Що таке контролер пам'яті у процесорі. Intel вбудуватиме контролери пам'яті в процесори? DDR4 - найшвидша, найпростіша в апгрейді та купівлі пам'ять

29.04.2020 Новини

Велика пропускна здатність системної пам'яті, і невелике значення затримки пам'яті завжди були актуальними. З моменту виникнення AnandTech - з 1997 року відбувається розвиток пам'яті: перехід з EDO на SDRAM, з PC66 на PC133, з SDR на DDR, і навіть з VC на DRDRAM. Лише використання DDR SDRAM підвищує продуктивність Athlon на 20-30 відсотків. Крім того, відомо, наскільки важливим є значення затримок при великій пропускній здатності пам'яті. Постає питання: якщо виробники процесорів можуть випускати настільки потужні процесори, чому ніхто не може для них придумати ефективний спосіботримання даних із пам'яті?

Розглянемо шлях, який проходять дані перед тим, як потрапити з пам'яті в процесор. Коли процесор виконує зчитування із системної пам'яті, в першу чергу команда посилається системною шиною в північний міст чіпсету, який потім передає її вбудованому контролеру пам'яті. Саме в цих перших кроках ховаються підводні камінці. Іноді (хоча й рідко – адже системна шина та шини пам'яті зазвичай синхронізуються) не вистачає пропускної спроможності системної шини. Внаслідок цього знижується швидкість читання з пам'яті. Набагато частіше трапляються великі затримки через неефективну роботу північного мосту та контролера пам'яті.

Далі, коли контролер пам'яті отримав команду на зчитування, по шині пам'яті запит пересилається на згадку, і через кілька операцій знайдені дані пересилаються назад, на контролер пам'яті. Потім контролер пам'яті приймає ці дані і передає на інтерфейс системної шини на північному мосту, і ці дані потрапляють у процесор.

Що стосується другої половини цього процесу, все залежить повністю від типу пам'яті, що використовується, і частоти шини пам'яті. Однак за допомогою чіпсету та системної шини можна вплинути на швидкість виконання першої та кількох останніх операцій.

Можна було б застосувати проміжний кеш L3 як спосіб скорочення затримок і як спосіб збільшення завантаження каналу між північним мостом та процесором, але AMD вибрала інтеграцію контролера пам'яті прямо у процесор.

Рис. 6. Схема процесора Hammer

Від цього не тільки скорочуються затримки в роботі з пам'яттю (тепер запити на запис/зчитування пройдуть зовнішній північний міст), але суттєво скорочуються шанси того, що чіпсет гальмуватиме загальну продуктивністьплатформи. Ми бачили безліч прикладів того, як Athlon не досягав максимальної продуктивностілише завдяки платформам, які працюють негаразд, як належить. Тому нічого краще, як позбутися джерела проблем та інтегрувати контролер пам'яті в процесор, вигадано не було.

Архітектура Hammer звертається до вбудованого контролера пам'яті (MCT) та вбудованого контролера DRAM (DCT). Контролер пам'яті є узагальнений інтерфейс між ядром Hammer і контролером DCT. Цей контролер розуміє, що таке пам'ять взагалі, але він аж ніяк не прив'язаний до конкретного типу пам'яті, що використовується. Контролер пам'яті підключений до DCT, який є більш специфічний пристрій, що працює лише з певними типами пам'яті. Теоретично AMD могла створити Hammer з підтримкою DDR SDRAM, і Hammer з підтримкою RDRAM просто змінивши контролер DTC, але зауважимо, що користі використання RDRAM для Hammer вкрай мало. Один із недоліків RDRAM - надто великі затримки, що проявляються досить часто. Один із способів вирішення цієї проблеми – використання RDRAM спільно з процесорами з довгими конвеєрами, як у Pentium 4. Зрозуміло, що конвеєр Hammer не такий довгий, і тактова частота у нього не зможе компенсувати затримки RDRAM, як зроблено у Pentium 4. Тому рішення AMD залишитися з DDR SDRAM цілком розумно.

Перші процесори на архітектурі Hammer мали або 64-бітний, або 128-бітовий контролер DDR SDRAM. Контролер DCT може підтримувати тактові частоти 100, 133 або 166МГц під DDR200, DDR266 або DDR333 SDRAM. AMD ясно дала зрозуміти, що у пізніших версіях Hammer DCT контролер DDR поміняють на контролер DDR-II.

Порівняння пропускної спроможності пам'яті

Тип пам'яті 64-біт DCT 128-біт DCT
DDR200 1.6Гбайт/с 3,2 Гбайт/с
DDR266 2,1 Гбайт/с 4,2 Гбайт/с
DDR333 2,7 Гбайті/с 5,4 Гбайт/с

Розташування контролера пам'яті безпосередньо на кристалі означає ще й те, що швидкість доступу до пам'яті безпосередньо залежить від тактової частоти, оскільки дані потрапляють у процесор, минаючи системну шину. Як приклад на Microprocessor Forum AMD навела теоретичний 2ГГц Hammer із затримкою пам'яті всього 12 нс (праворуч ви бачите конвеєр Hammer). Очевидно, сюди не входить час зчитування даних із пам'яті, але в будь-якому випадку це виявляється набагато швидше роботичерез зовнішній північний міст. Отже, AMD збирається збільшити кількість інструкцій, що виконуються за такт за рахунок збільшення швидкості зчитування даних із пам'яті. В результаті цього, виконавчі пристрої Hammer будуть краще забезпечені даними, ніж виконавчі пристрої Athlon.

Рис. 8 Час зчитування

даних із пам'яті

Отже, вбудований контролер пам'яті переймає одну з основних функцій зовнішнього північного моста. AMD пішла далі і практично вбудувала північний міст у кристал процесора. Єдине, що залишилося частку традиційного зовнішнього північного мосту - це контролер AGP. Це практично усуне всі проблеми з продуктивністю, які виникли б при використанні Hammer з чіпсетами її часу, до того ж, це ощасливило виробників материнських плат - адже значно спроститься компонування доріжок між пам'яттю і процесором.

Нижче наведено приклад однопроцесорної системи Hammer.

Рис. 9. Типова "архітектура" AMD Hammer

Як видно, єдиний чіп, що є на материнській платі (крім південного мосту) – це контролер AGP 8X. Він взаємодіє із процесором по шині HyperTransport. В пошуках дешевого рішення, виробники чіпсетів просто створять один єдиний чіп, який виконуватиме всі традиційні функції південного мосту плюс функції контролера AGP 8X.

Крім того, на зображенні видно лише два банки пам'яті. AMD заявила, що однопроцесорні системи на базі Hammer підтримуватимуть максимум 2 небуферизовані DIMM.

Оперативна пам'ятьє сховищем динамічної інформації, змінних, та інших даних, що використовуються, можуть бути використані в Наразі, або до яких просто може бути необхідний швидкий доступ. Також оперативна пам'ять є буферним сховищем під час передачі даних іншим пристроям

Що можна віднести до головних параметрів, що характеризують модулі ОЗП і зумовлюють їх продуктивність, в першу чергу це їх обсяг, частота, таймінги (затримки), а також сам тип пам'яті і контролер пам'яті, що використовується.

Типи пам'яті

Почнемо з типів пам'яті. Сьогодні на ринку представлені три покоління пам'яті: SDRAM DDR, SDRAM DDR II, SDRAM DDR III, що відрізняються один від одного, здебільшого лише швидкодією. Так само існують різні типипам'яті, орієнтовані насамперед на два типи платформ: домашні та серверні. Для домашніх ПК використовується звичайна DIMM SDRAM DDR (II, III) пам'ять, для серверних пам'ять типу registered, buffered і прийшла їм на зміну full buffered (FBDIMM). Відрізняються останні три від звичайних модулів підвищеною надійністю цілісності даних, а саме, наявністю спеціальних буферів для зберігання надлишкової інформації, системою корекції помилок та контролем контрольних сум, забезпечується використанням додаткових чіпів на планках пам'яті. Всі ці заходи покликані гарантувати підвищену надійність даних, але на жаль додаткова точка шляху даних негативно позначається на швидкодії пам'яті.

Обсяг пам'яті

Об'єм пам'яті може дуже позначитися на продуктивності системи, особливо якщо відчувається сильний недолік пам'яті в ПК, головним чином справа в тому, що Операційні системи, при нестачі фізичної пам'яті, створюють віртуальну пам'ять, Так званий файл підкачки, це як би оперативна пам'ять зберігається на жорсткому диску, але через значно нижчу швидкість вінчестерів в порівнянні з RAM, швидкодія дуже сильно падає.

Тактова частота RAM

Як і багатьох інших пристроях ПК, у швидкодії ОЗУ грає роль її тактова частота. Що стосується оперативної пам'яттю, тактова частота - основний показник швидкодії модуля пам'яті. Попередня пам'яті DDR - SDR, працювала на однаковій частоті із системною шиною, і за один такт шини FSB виконувався, один такт пам'яті, в пам'яті DDR (Double Data Rate), за один такт системної шини виконується два такти пам'яті, що дозволяє їй працювати на подвоєної частоти.

Таймінги

Ще одним важливим показником швидкодії пам'яті є таймінги, затримки в тактах від подачі команди до її виконання.

У пам'яті SDRAM для роботи з пам'яттю необхідно спочатку вибрати чіп, з яким виконуватимуться дії. Робиться це командою CS# (Chip Select). Потім вибирається банк та рядок. Перед початком роботи з будь-яким рядком потрібна її активація. Робиться це командою вибору рядка RAS # (при виборі рядка вона активується). Потім (при операції лінійного читання) вибирається рядок командою CAS # (ця команда ініціює читання). Потім зчитуються дані та закривається рядок, здійснивши попередній заряд (precharge) банку.

Зазвичай специфікації до пам'яті є написи виду 3-4-4-8 або 5-5-5-15, це скорочений запис (так звана схема таймінгів) основних таймінгів пам'яті. Ця схема включає затримки CL - Trcd - Trp - Tras відповідно. А тепер докладніше про кожну затримку.

CL, Cas Latency – мінімальний час між подачею команди на читання (CAS) та початком передачі даних (затримка читання).

Trcd, RAS to CAS delay - час, необхідне активізації рядка банку, чи мінімальний час між подачею сигналу на вибір рядка (RAS #) і сигналу вибір стовпця (CAS #).

Trp, Row Precharge - час, необхідне попереднього заряду банку (precharge). Іншими словами, мінімальний час закриття рядка, після чого можна активувати новий рядокбанку.

Контролери пам'яті

Тепер про контролера пам'яті. Контролер пам'яті встановлений не на чіпах пам'яті і навіть не на планці, тоді чому вона розглядається тут? Тому що контролери пам'яті розташовуються в різних пристроївах ПК, їх можна знайти як на материнській платі, де вони спочатку і "мешкали", так і на процесорі, куди вони "переїхали" порівняно недавно. Вбудовані в процесор контролери пам'яті використовуються в ЦПУ компанії AMD досить давно, а в процесорах від Intel , Зовсім недавно, з появою архітектури Nehalem (процесори Core i7) і сокету Socket 1366, до цього для процесорів у виконанні socket 775 використовувався вбудований в північний міст контролер пам'яті.Контролер пам'яті не тільки визначають максимальну частоту і тип пам'яті, але і кількість Раніше використовувався один контролер пам'яті, що дозволяє одночасно працювати тільки з одним модулем пам'яті, потім компанією nVidia була впроваджена ідея використання двоканального контролера пам'яті, який був здатний працювати з двома модулями одночасно, сьогодні ж в нових процесорах Core i7 використовуються триканальні контролери пам'яті Хоча робота в такому режимі і потребує деяких особливостей ; у слотах різних контролерів повинні бути вставлені якщо не ідентичні, то дуже схожі за характеристиками модулі, інакше контролер перейде в одноканальний режим. Тому виробники ОЗУ стали продавати пам'ять комплектами, по два чи три модулі, з однаковими таймінгами, частотами, і випущені в одній партії, що теж до речі важливо для нормальної роботи.

Першого місяця осені ми активно розбираємо питання вибору оперативної пам'яті для нового персонального комп'ютера. Бо всі сучасні системипідтримують виключно DDR3 тип пам'яті, саме про неї ми й говоримо у статтях. У попередніх статтях ми розібрали питання щодо вибору планок оперативної пам'яті та її типів, в окремій статті ми зупинилися на питаннях вибору оптимального обсягу пам'яті для персонального комп'ютера. У цій завершальній оглядовій статті ми хотіли б зупинитися на питаннях вибору оперативної пам'яті стосовно процесорних платформ, що існують на ринках.
Розгляд сокетних платформ слід розпочати з того, що кожен процесорний сокет розрахований на певний тип процесорів, а материнських плат випускаються власні чіпи. Контролер оперативної пам'яті вбудований в сучасні процесори, тому можна сміливо заявляти, що тип пам'яті, що рекомендується, повністю залежить від центрального процесора, а тип застосованого процесора від обраного сокету і платформи. Почнемо розгляд із популярних сокетних платформ компанії AMD.

Однією з популярних і одночасно засмучували користувачів виявився сокет A MD Socket FM1. Цей сокет призначений для використання процесорів AMD Llano. Дані процесори мають інтегрований контролер оперативної пам'яті та непогане графічне ядро. Максимальною офіційно підтримуваною робочою частотою планок оперативної пам'яті для цього сокету є частота 1866 МГц. Тому ми рекомендуємо купувати саме дані планки оперативної пам'яті, оскільки вони є достатньо доступними на сьогоднішній день. Слід окремо виділити, що контролер процесорів формату FM1 має здатність показувати відмінний розгінний потенціал пам'яті, тому має сенс придивитися до модулів, що добре розганяються, якщо ви плануєте розгін на базі даної платфоми.

Картинка клікабельна


Буквально за два тижні офіційно повинні будуть представлені нові процесори на базі платформи Socket FM2для процесорів AMD Trinity. Компанія AMD, яка славилася наступністю платформ, "кинула" покупців платформи FM1 і вони тепер не зможуть встановити в свою систему процесори нового покоління.

Нові процесори AMD Trinity засновані на архітектурі Piledriver, тобто обчислювальні ядра даних процесорів повинні працювати швидше, ніж у AMD Llano. Повідомляється про оновлення інтегрованої графіки у процесорах. Зокрема найшвидшим графічним блоком буде AMD Radeon HD 7660D. Слід зазначити, що архітектура даних ядер не аналогічна архітектурі. дискретних відеокарт AMD Radeon HD 7000, наприклад, ядра Tahiti, тому покладати особливих надій на красиві цифри не слід.

Істотним обнадійливим фактом може вважатися те, що AMD обнадіяла користувачів довгим існуванням сокету FM2, тому покупців цієї платформи спіткає врахувати власників Socket FM1 вже через рік після анонсу.

За попередніми даними, контролер пам'яті двоядерного процесора AMD A6-5400K з інтегрованою графікою AMD Radeon HD 7540D та рівнем тепловиділення 65 ват буде підтримувати пам'ять типу DDR3 з максимальною частотою лише 1600 МГц. Всі інші старші рішення AMD A8-5500, AMD A8-5600K, AMD A10-5700 повинні будуть підтримувати найшвидшу сертифіковану пам'ять DDR3 - 1866 МГц.

Слід зазначити, що покупцям AMD A6-5400K не слід ганятися за пам'яттю DDR3-1600 МГц. Звичайний розгін дозволить досягти частоти 1866 МГц, а якщо ви відмовитеся від розгону - пам'ять все одно зможе працювати так само, як і звичайна з робочою частотою 1600 МГц. А ось при продажі планок пам'яті на вторинному ринку у вас можуть виникнути проблеми з продажем застарілої DDR3-1600 МГц.

Контролери у процесорів AMD Llano та AMD Trinity двоканальні, тому планки необхідно купувати парні.

Картинка клікабельна


Сокет AM3 AMD є першою платформою для процесорів з інтегрованим контролером оперативної пам'яті типу DDR3. Попередні платформи 939, AM2, AM2+ підтримували лише DDR2 тип пам'яті. Контролер даних процесорів двоканальний, тому оперативну пам'ять необхідно встановлювати парною кількістю планок. Офіційною базовою частотою даних процесорів є 1333 МГц типу DDR3. При планованому розгоні має сенс набувати швидших планок. Так як платформа AM3 йде в історію, при покупці нового комп'ютера все одно необхідно брати найбільш оптимальну пам'ять вартості, бажано з робочою частотою 1866 МГц. Інтегровані профілі дозволять їй запуститися на базовій частоті 1333 МГц.

Не слід забувати про існування процесорів з розблокованим множником для платформи AM3 – серії AMD Black Edition. Контролери оперативної пам'яті даних процесорів підтримують планки із частотою до 1600 МГц. Незважаючи на це, досвід показує, що контролери даних процесорів практично не можуть вийти за межі частоти в 1866 МГц, тому купувати оверклоккерські комплекти пам'яті для даних рішень не має сенсу.

Картинка клікабельна


Останнім поколінням сокетів від AMD для звичайних процесорів є AM3+. Цей сокет створений для процесорів серії Bulldozer і процесорів Vishera, що готуються до початку продажів. На цих архітектурах базуються процесори AMD FX. Всі ці процесори мають оновлений двоканальний контролер пам'яті, тому планки слід купувати попарно. Офіційно підтримуваною частотою є цифра 1866 МГц. Користувачі активно і агресивно розганяють процесори серії AMD FX, тому рекомендується придивлятися до модулів, що добре розганяються. Контролер даних процесорів легко може підкорити цифру в 2133 МГц пам'яті, тому найчастіше обмежуючим чинником виявляються модулі пам'яті.

Картинка клікабельна


Поступово ми переходимо до розгляду сокетів компанії Intel. Основною сокетною платформою компанії є LGA 1155, який використовується для процесорів старого покоління Intel Sandy Bridge та нового покоління Inte Ivy Bridge. Контролер оперативної пам'яті даних процесорів двоканальний, тому планки слід купувати та встановлювати попарно. Якщо ви збираєте платформу для розгону на відповідному чіпсеті материнської платиі купуєте відповідний процесор серії "K", то треба придивлятися до оверклокерської оперативної пам'яті з робочою частотою 2133 Мгц або навіть 2400 Мгц.

Якщо ж ви не плануєте розгін або не знали, що потрібно купувати материнські плати на чіпсетах з маркуванням "P" або "Z", і процесор з розблокованим множником - сенсу витрачати кошти немає. Придбаєте стандартні модулі пам'яті та живете спокійно.

На сокеті LGA 1156ми зупинятись не будемо, оскільки вона пішла в історію. Лише зазначимо, що контролер даних процесорів двоканальний. Для розгону також рекомендується придбати хороші модулі пам'яті. У багатьох випадках можна обійтися планками з робочою частотою 1866 МГц.

Картинка клікабельна


Платформа LGA 1366на відміну від LGA 1156 продовжує своє життя. Дана платформа є першою та єдиною з наявністю триканального контролера оперативної пам'яті у процесорах. Особливості розгону процесорів на ядрі Gulftown говорить про те, що для успіху необхідно набувати якісних комплектів оверклокерської оперативної пам'яті. Якщо бюджет обмежений, можна обмежитися планками з частотою 1866 МГц.

Картинка клікабельна


Платформа LGA 2011- Рішення для ентузіастів охочих купити процесори Intel Sandy Bridge-E. Вартість процесорів та материнських плат даного форматузнаходяться на найбільш високому рівні. Процесор має чотириканальний контролер оперативної пам'яті, тому встановлення чотирьох модулів одночасно - мінімальна вимогадля користувача. Враховуючи високу вартість оверклокерських комплектів на чотири планки пам'яті, рекомендувати їх купівлю ми можемо лише за необмеженості бюджету. У стандартному випадку звичайні планки на 1866 МГц від Samsung чи Hynix.

Дуже хочеться сподіватися, що ця стаття допоможе визначитися з вибором пам'яті для свого процесора.

Контролер пам'яті

Контролер пам'яті- Цифрова схема, що управляє потоком даних до і від оперативної пам'яті. Може являти собою окрему мікросхему або бути інтегрована в більш складну мікросхему, наприклад, північний міст , мікропроцесор або систему на кристалі .

Комп'ютери, що використовують мікропроцесори Intel традиційно мали контролер пам'яті, вбудований у чіпсет (північний міст), але багато сучасних процесорів, такі як DEC / Compaq Alpha 21364, AMD Athlon 64 і Opteron, IBM POWER5, Sun Core Systems UltraSPARC T1 і процесори інтегрований контролер пам'яті, розташований на тому ж кристалі, зменшення затримки доступу в пам'ять. Хоча інтеграція збільшує продуктивність системи, відбувається прив'язка мікропроцесора до якогось одного типу пам'яті, що не дозволяє поєднувати процесори та пам'ять різних поколінь. Для використання нових типів пам'яті потрібен випуск нових процесорів та зміна їх роз'єму (наприклад, після появи DDR2 SDRAM, AMD випустила процесори Athlon 64, які використовували новий сокет Socket AM2).

Інтеграція контролера пам'яті з процесором не є новою технологієюТак, ще в 1990-х DEC Alpha 21066 і HP PA-7300LC використовували вбудовані контролери для зниження вартості системи.

Завдання

Контролер пам'яті містить логічні ланцюги, необхідних проведення операцій читання і записи в DRAM , і навіть оновлення збережених у DRAM даних. Без періодичних оновлень чіпи пам'яті DRAM втрачають інформацію, оскільки розряджаються струмами витоку конденсатори, що зберігають біти. Типовий час надійного зберігання інформації становить частки секунди, але не менше 64 мілісекунди відповідно до стандартів JEDEC. На триваліших періодах часу інформація зберігається лише частково.

Багатоканальна пам'ять

Повністю буферизована пам'ять FB-DIMM

Примітки


Wikimedia Foundation. 2010 .

  • Контрнаступ Східного фронту
  • Контроль (значення)

Дивитись що таке "Контролер пам'яті" в інших словниках:

    Контролер переривань- (англ. Programmable Interrupt Controller, PIC) мікросхема або вбудований блок процесора, який відповідає за можливість послідовної обробки запитів на переривання від різних пристроїв. Зміст 1 PIC 2 APIC … Вікіпедія

    контролер доступу до пам'яті- - [Е.С.Алексєєв, А.А.Мячов. Англо-російський тлумачний словник з системотехніки ЕОМ. Москва 1993] Тематики інформаційні технологіїв цілому EN memory access controllerMAC …

    Осередок пам'яті ЕОМ- Запит «ОЗУ» перенаправляється сюди. Див. також інші значення. Найпростіша схемавзаємодії оперативної пам'яті з ЦП Оперативна пам'ять (також оперативний пристрій, ОЗУ) в інформатиці пам'ять, частина системи пам'яті ЕОМ, в яку … Вікіпедія

    Програмований контролер переривань- Контролер переривань мікросхеми або вбудований блок процесора, що відповідає за можливість послідовної обробки запитів на переривання від різних пристроїв. Англійська назва Programmable Interrupt Controller (PIC). Як правило… … Вікіпедія

    Прямий доступ до пам'яті- (англ. Direct Memory Access, DMA) режим обміну даними між пристроями або між пристроєм і основною пам'яттю (RAM) без участі Центрального Процесора (ЦП). В результаті швидкість передачі збільшується, тому що дані не ... Вікіпедія

    програмований логічний контролер- ПЛК [Інтент] контролер Керуючий пристрій, що здійснює автоматичне керування за допомогою програмної реалізаціїалгоритмів керування. [Збірник термінів, що рекомендуються. Випуск 107. Теорія управління. Академія наук СРСР. Комітет науково… Довідник технічного перекладача

    Функціональний контролер- Схематичне розташування південного мосту на системній платіПівденний міст (від англ. Southbridge) (функціональний контролер) також відомий як контролер концентратор введення виведення від англ. I/O Controller Hub (ICH). Це мікросхема, яка … Вікіпедія

    USB-контролер- у складі платформи персонального комп'ютера забезпечує комунікацію з периферійними пристроями, підключеними до універсальної послідовної шини USB контролер є інтелектуальним пристроєм, здатним взаємодіяти з ... Вікіпедія

    Програмований логічний контролер- Масово застосовуваний програмований логічний контролер сімейства SIMATIC S7 300 Програмований логічний контролер (ПЛК) (англ. Programmable Logic Controller, PLC) або програмований контролер еле ... Вікіпедія

    професійний графічний контролер- Контролер має 320 Кбайт пам'яті. Роздільна здатність - 640х480 елементів зображення. Можливість відображати 256 кольорів із палітри, що містить понад 16 млн. відтінків. Тематики інформаційні технології загалом EN… … Довідник технічного перекладача

З моменту появи процесорів на ядрі Nehalem однією з їх переваг все вважали інтегрований триканальний контролер пам'яті. Не просто інтегрований контролер пам'яті (ІКП скорочено), а саме триканальний. Зрозуміло, чим це «круто» - все-таки одноканальні та двоканальні контролери пам'яті у AMD були ще за п'ять років до цього, так що додатковий канал, та ще й найбільш швидкісний на даний момент пам'яті типу DDR3, мав дуже серйозну перевагу. На думку багатьох користувачів, також є одним з основних факторів, яким процесори лінійки Core i7 зобов'язані своєю високою продуктивністю. Варто зауважити, що сама компанія Intel цю думку ніяк не спростовувала, за що й трохи поплатилася - по-справжньому масові процесори архітектури Nehalem, які будуть випущені на початку осені, розраховані на конструктив LGA1156, який передбачає використання лише двох каналів пам'яті. Здавалося б, серйозний недолік нових моделей, який нездатний дозволити їм конкурувати зі старшими братами. Але чи це так?

В оглядах материнських плат ми вже намагалися оцінити корисність багатоканального режиму пам'яті в процесорах під LGA1366, і результати виявилися невтішними. Для режимів, зрозуміло, а чи не для користувачів. Однак перевірки проводилися на дуже обмеженій кількості додатків, тому остаточної відповіді на питання, чи потрібен триканальний режим на практиці, вони не давали. Зараз ми вирішили заповнити цю прогалину. Точніше, спочатку просто виникло бажання випробувати не три-, а двоканальний режим, для подальшого коректнішого порівняння продуктивності Core i7 900-ї та 800-ї серій: щоб потім не будувати гіпотез про те, що найсильніше вплинуло на результати (якщо вони, дійсно, виявляться суттєво різними). Однак просто «прогнати» тести з останньої версії нашої методики в ще одній конфігурації – надто нудно, та й з такого протистояння лише двох варіантів гарної статті вийти не може, тому ми трохи ускладнили завдання.

Конфігурація тестових стендів

Усі тестування проводилося з використанням процесора Core i7 920, материнської плати Intel DX58SO («Smackover») і референс-відеокарти на базі NVIDIA GeForce GTX 275 - словом, як все належить, згідно з версією 4.0 нашої методики тестування. Розрізнялася лише пам'ять. Крім звичайно використовуваного нами комплекту Kingston, ми взяли ще й кит від Apacer, що має вдвічі менший обсяг. Всі модулі підтримують роботу на вищих частотах, ніж офіційні для Core i7 920 1066 МГц, але ми тестували їх саме на цій частоті за схемою 8-8-8-19.

Вийшло чотирьох конфігурацій, представлених у таблиці:

Чому саме вони? Дві триканальні нам потрібні, щоб чітко зрозуміти - що важливо в якомусь додатку: триканальність чи сумарний обсяг? Це буде добре видно за результатами: якщо і 3×2, і 3×1 у переможцях, значить, користь від трьох каналів є, якщо тільки перший, отже, додатку просто потрібно багато пам'яті (точніше, воно здатне її використовувати). Без 3×1 до однозначної відповіді було б складно. Корисність участі у тестах 2×2 очевидна - саме таким чином комплектуються сучасні системи на Core 2 та процесорах AMD, І саме він на деякий час стане вельми масовим для систем на LGA1156 (звісно, ​​можна було б протестувати пам'ять і в конфігурації 2×1, але це вже з точки зору систем, що не належать до бюджетного сектора, зовсім не цікаво). 1×4 виглядає вкрай синтетичним, оскільки навряд чи хтось, маючи два модулі пам'яті по 2 ГБ, їх встановлюватиме в один канал, «знехтуючи» інші, проте… Він нам потрібен для підвищення загальної освіченості. Та й модулі DDR3, ємністю 4 ГБ, вже з'явилися. На жаль, поки що це екзотика, яка навіть до наших рук не дісталася (інакше б у списку тестованих обов'язково був би і варіант 2×4), проте масове поширення на ринку як таких модулів, так і китів на їх основі лише питання часу.

Детальні результати всіх підтестів, як завжди, представлені в таблиці , форматі Excel. Зауважимо, що в сьогоднішньому тестуванні вони будуть іноді навіть більш цікавими, ніж загальні середні показники по групах, тому тим, кому цікава детальна інформація, не варто відмовляти собі в задоволенні з ними познайомитися.

Пристрілка

Але для початку ми вирішили перевірити продуктивність кожного з варіантів у синтетичній програмі, в ролі якої сьогодні виступав Everest 4.6 (так, це далеко не остання версіяпопулярного тестового пакета, однак і «реальний» софт оновлюється далеко не миттєво, так що ці результати нам дуже цікаві навіть якщо припустити слабку оптимізацію 4.6 під Nehalem).

І перші ж результати дещо бентежать - як ми бачимо, жодного видимого приросту від залучення третього каналу ІКП немає. Більше того - три модулі від Apacer справляються з цим завданням повільніше, ніж два від Kingston. Водночас одноканальний режим – явний аутсайдер. Теоретична ПСП DDR3 1066 складає 8528 МБ/с, у що ми вперлися - це зрозуміло. Але додавання ще одного каналу збільшує швидкість читання далеко не в два, а менш ніж у півтора рази, а третій взагалі нічого не дає.

Зі швидкістю запису все ще веселіше – одноканальний режим чесно вперся у теоретичну ПСП, а збільшення кількості каналів дало лише менше 20% у всіх випадках.

І, зрештою, затримки доступу. Очевидний лідер тут - двоканальний режим (нагадаємо, що на цій діаграмі що менше цифри, то краще), хоча й одноканальний доступ справа не сильно погіршує, але в триканальному режимі затримки порівняно сильно зростають: на чверть.

Вже можна робити певні висновки. Як ми пам'ятаємо з поведінки інших архітектур з ІКП (AMD K8/K10), вони найбільш сприйнятливі саме до затримок доступу до пам'яті, що дуже помітно в реальних додатках. Навряд чи Nehalem поводитиметься суворо навпаки. Причому все це на тлі однакових швидкостей читання та запису, тобто двоканальний режим має стати лідером. Одноканальний - вже не факт, що буде надто швидким: затримки менші, але й ПСП набагато нижчі, а це не може не позначитися. Наскільки сильно – ми й перевіримо. І принагідно подивимося, як різні додатки ставляться до різного повного обсягу пам'яті: синтетичні бенчмарки жодної інформації з цього приводу не можуть дати.

3D-візуалізація

В аутсайдерах опинилися обидві триканальні конфігурації, з чого можна зробити висновок, що головне для цієї групи додатків - затримки доступу. Але ці два варіанти поводяться по-різному, а вивчення докладних результатів тестів показує досить строкату картину, з чого можна дійти невтішного висновку, що деяким додаткам вже недостатньо як трьох, а й чотирьох гігабайт пам'яті.

Рендеринг тривимірних сцен

Рендеринг взагалі мало сприйнятливий до характеристик системи пам'яті, що можна було припускати і від початку - тут головне саме «подрібнені» здібності обчислювальних ядер та їх кількість (та й «віртуальні» потоки обчислення теж сприймаються позитивно). Причому і до обсягу пам'яті вимог особливих немає - аби її вистачало для сцени, що прораховується, і накладних витрат. Для наших тестів цілком достатньо 3 ГБ, що демонструє нам діаграма вище.

Наукові та інженерні розрахунки

А в цій групі з'являється ще один клас додатків, крім тих, кому потрібно якомога більше пам'ятіі кому обсяг не важливий – ті, хто починає залежно від збільшення ОЗП працювати повільніше. На перший погляд, ситуація незрозуміла - якщо швидкість падає від нестачі пам'яті, це легко зрозуміти, але надлишок просто ніхто не повинен «помітити». З іншого боку - а чому не винен? Ефективність кешування цілком може залежати від об'єму ОЗП і повинна від нього залежати. Якщо конкретний додатоквикористовує лише невеликий обсяг пам'яті, причому постійний, йому «діставатиметься» різний обсяг кеш-пам'яті процесора. Наприклад, при шести встановлених гігабайтах лише половина з 8 МБ кешу L3 буде відведена для даних програми «переднього плану» (не забуваємо, що в пам'яті, що залишилася, теж може хтось «жити», хай і не дуже активно, але на кеш при цьому претендувати), а за трьох їх обслуговуванням займатимуться вже 2/3 від 8 МБ. Цікавий ефект, звичайно, шкода лише трохи осторонь основної теми нашого дослідження лежить. З нею все, як завжди - в середньому, найшвидшим виявляється двоканальний режим, а з двох варіантів триканального, незважаючи на наявність згаданих вище додатків-ренегатів, продуктивніше той, де сумарний обсяг пам'яті вищий.

Растрова графіка

Здебільшого все зрозуміло, оскільки серед растрових редакторів нам зустрічаються всі три вже певні «групи» додатків. Хоча і з деякими варіаціями - так, наприклад, обом продуктам Corel все одно, скільки пам'яті і який - 3 або 4 ГБ неважливо, але аби не 6. Але виявився просто дуже «пам'ятний» додаток - Adobe Photoshop. Причому тут дуже цікавим є не загальний результат підтестів, а деякі з них окремо. Точніше, один – Convert. І настільки цікавий, що продублюємо у статті відповідний шматок таблиці із «сирими» даними.

Core 2 Quad Q9300 2×2Core i7 920 3×2Core i7 920 2×2Core i7 920 1×4Core i7 920 3×1
0:09:07 0:04:45 0:08:05 0:08:12 0:17:42

Висновок? Незважаючи на те, що більшість оглядів в мережі, де порівнюються процесори різних архітектур у цьому додатку (у меншості оглядів тесту Photoshop просто немає, так що можна навіть сказати, що у всіх статтях такого роду), стверджується, що Core i7 просто ідеальний процесор для Photoshop, як бачимо, нічого особливо видатного у ньому немає. Ідеальним тут не архітектура ядра, а кількість пам'яті. При 6 ГБ Core i7 920 вдвічі обганяє Core 2 Quad Q9300, забезпечений лише 4 ГБ. Саме такі порівняння у більшості статей і зустрічаються (у тому числі і на нашому сайті, але й інші ресурси поводяться аналогічно): 3х2 для процесорів під LGA1366 та 2х2 для Core2, AMD Phenomі т.п. Але якщо ми обмежимо перший із процесорів тими ж 4 ГБ (причому неважливо, яким чином набраними), то з'ясовується… що відмінність від Core 2 Quad цілком укладається в допустиме, з погляду різниці тактовою частотою. А якщо ми відберемо у Core i7 ще всього один гігабайт пам'яті (здавалося б - 3 або 4: невелика різниця), то результат погіршиться ще вдвічі! Це найбільш показовий приклад, проте й інші підтести поводяться подібним чином, хоч мікроскопічну, але знаходять різницю завжди. І нічого не поробиш - Photoshop дійсно пам'ять «любить», причому чим більше «важать» файли, що обробляються в ньому, тим більше «любить», а всі утиліти тестування продуктивності в даному додатку(а не тільки наші самописні тести), звичайно, оперують саме великими файлами.

Втім, не можна сказати, що у високих результатах немає заслуги самого Core i7, лише преференції від великої кількості пам'яті. Триканальний ІКП таки дозволяє встановити більше пам'яті за інших рівних умов. Але про це докладно ми поговоримо трохи згодом.

Стиснення даних

Програми-архіватори не вміють використовувати занадто великий обсяг пам'яті, тому він просто шкодить - до доступної ємності кеш-пам'яті вони дуже сприйнятливі. До затримок основного ОЗУ ще сприйнятливіші, тому й маємо таку картину - найповільнішою конфігурацією є 3х2, а вийти на перше місце 3х1 заважає латентність.

Компіляція (VC++)

Компільований нами проект великої кількості пам'яті не вимагає, тому важливі затримки, а також трохи швидкості читання та запису. Тому двоканальний режим доступу до пам'яті тут виявився найкращим, але одноканальний лише трохи виграв у триканальних – латентність нижча, але й інші параметри теж.

Java

Тест Java-машини виявився дуже сприйнятливим до швидкості читання з пам'яті, але її загальний обсяг йому досить важливий. Саме таку картину можна було б очікувати скрізь, якби вірними були наївні припущення, що триканальний доступ до пам'яті є запорукою високої продуктивності, але пам'яті при цьому багато не буває. Жаль тільки, що серед протестованих додатків ці мрії підтверджені буквально пару-трійку разів. Але якраз приклад, коли підтверджені.

Кодування аудіо

Прекрасне завдання – вимоги до системи пам'яті, можна сказати, відсутні. При рендерингу вони теж майже були відсутні, а тут зовсім відсутні. Ідеальний бенчмарк процесорів, щоправда, огидний для тестування системи загалом.

Кодування відео

А ось тут усе майже так, як має бути у «наївній теорії». Псує картинку лише недостатньо помітний програш двоканального режиму. Точніше, буде сказати, майже непомітний. Та й тому, що він взагалі є, ми завдячуємо одному додатку - DivX. Приклад оптимальної оптимізації під всі особливості сьогоднішні Core i7. Як він поведеться на «завтрашніх» перевірятимемо вже менш ніж через місяць.

Ігрове 3D

Дуже спокійна трохи незрозуміла загальна картина. Однак під зовнішнім спокоєм у детальних результатах таїться справжня буря. Пристрасті ігор сильно розділилися, а в яких як - залишимо завдання для самостійного вивчення. Головний висновок - для ігор (саме як безлічі, а чи не однієї конкретної гри) питання зміни пам'яті перестав бути якимось важливим. Загалом, вирішувати його навіть менш необхідно, ніж питання вибору центрального процесора (зрозуміло, якщо не йдеться про зовсім бюджетний сектор, типу Core 2 Duo або взагалі Pentium / Celeron). Головним же питанням, яке стоїть перед «хардкорним» геймером сьогодні, буде: «Потягну на multi-GPU чи доведеться свої бажання якось обмежувати?»

А навіщо взагалі потрібний триканальний ІКП?

Як бачимо, великої користі від залучення третього каналу контролера пам'яті в Core i7 LGA1366 немає. Канал – є, використовувати – можна, але результати далеко не завжди покращуються. Найчастіше навіть, навпаки, погіршуються. То навіщо компанія Intel робила ІКП саме триканальним? З бажання пограти м'язами (у конкурента два, а ми всі три зробимо)? Можливо, така спокуса теж була, але навряд чи - таки три канали даються досить високою ціною. Причому в прямому розумінні: розведення плат стає дуже складним, а складно – означає дорого. Процесори можна робити і недорогими (і використаний нами сьогодні Core i7 920 тому яскравий приклад - його роздрібна ціна як Core 2 Quad Q9650), але сама платформа виявляється дорогою. Причому без особливої ​​користі - для більшості «типово-користувальних» додатків зараз легко можна обмежитися двома модулями по 2 ГБ і не хвилюватися (особливо якщо врахувати відсоток тих, хто досі використовують 32-розрядні операційні системи, де більший обсяг ОЗУ просто не буде використовуватися). Як було сказано в хорошому анекдоті про верблюденя та його маму: «А навіщо нам ці навороти, якщо ми все одно живемо у зоопарку?»

У тому й річ, що нинішні Core i7, власне, в зоопарку і живуть. Найкращим чином під нього будуть пристосовані «справжні» настільні моделі, розраховані під виконання LGA1156, головною (та й взагалі – єдиною) відмінністю якого від LGA1366 є підтримка «всього лише» двоканального режиму пам'яті. А LGA1366 – платформа спочатку серверна. У серверах потрібно багато пам'яті. Ні 4, ні 8 і навіть ні 12 ГБ, а справді багато. Там і півсотні гігабайт легко можуть виявитись затребуваними, а то й недостатніми. Як можна встановити більше пам'яті в одну систему? Загальний обсяг дорівнює добутку кількості модулів з їхньої обсяг. Отже, необхідно збільшувати чи кількість, чи ємність кожного модуля. Друге – складно і від виробників процесорів/чіпсетів, взагалі кажучи, не залежить. Більше того - освоєння індустрією більш "щільних" мікросхем пам'яті благотворно позначається на всіх виробниках серверних платформ одночасно, тому не може стати конкурентною перевагою.

Отже, треба збільшувати кількість модулів, що підтримуються. А воно дорівнює (загалом) кількості контролерів пам'яті, помножених на кількість підтримуваних кожним модулів. Останнє - добуток числа каналів, що підтримуються, на число одночасно працюючих на кожному каналі модулів. Збільшувати останнє – дуже складне завдання, оскільки одночасно потрібно і швидкісні характеристикине погіршувати, як мінімум. Ця проблема навіть у настільних системах проявляється, де більше двох-трьох модулів на канал не використовується. Наприклад, може бути так: один модуль - DDR3 1333, два - DDR3 1066, три - DDR3 800. Дуже багато повільної пам'яті, звичайно, іноді краще ніж мало швидкої, але йти на такі витрати все одно небажано. А іноді й неможливо.

Над проблемою збільшення кількості модулів пам'яті, що підтримуються одним каналом контролера, в Intel працювали довго і небезуспішно. Однак виявилося, що кінцевий результат (FB-DIMM) спочатку задовольняє поставленим вимогам, але його використання викликає масу небажаних побічних ефектів.

Залишається тільки один шлях - по-перше, перенести контролер пам'яті в процесор, що в багатопроцесорній системі автоматично забезпечує нам підтримку кількох контролерів пам'яті. По-друге, збільшувати кількість каналів пам'яті. І те, й інше було зроблено. Результат? У системі на двох Xeon, так само як і в системі на двох Opteron, є два контролери пам'яті. Тільки в першій обидва триканальні, а в другій - двоканальні, що дає нам шість і чотири канали пам'яті відповідно. При встановленні двох модулів пам'яті на канал (дуже навіть щадний режим) у першій системі їх виявиться 12, а в другій - 8. Припустимо, кожен модуль має ємність 4 ГБ, тоді в першій системі виявиться 48 ГБ, а в другій - 32 ГБ. У ряді завдань це одразу забезпечить першій системі вагому перевагу. А як у сервері на Оптеронах тими самими модулями «добити» пам'ять до 48 ГБ? Легко – встановлюємо три модулі на канал і… вся система пам'яті починає працювати повільніше, оскільки, наприклад, затримки доведеться сильно збільшити. І виходить: при однаковій швидкості роботи пам'яті система «і» має у півтора рази більший її об'єм, ніж система «а», а за рівного об'єму система «і» працює з пам'яттю швидше, ніж система «а».

Саме тому Xeon триканальний контролер пам'яті потрібен. Він і в Opteron потрібний, але не вдалося свого часу зробити. Так само, як зараз Intel не вдалося чотири канали реалізувати. Все одно цим шляхом йти обом виробникам, оскільки альтернативним (а саме FB-DIMM і кількість модулів на каналі збільшувати) один з них вже йти пробував і залишився не дуже задоволеним.

А навіщо все це у зоопарку, на робочому столі звичайного користувача? Правильно – нема чого. Кому потрібно – ті багатопроцесорну робочу станцію куплять і зведуть завдання до попередньої. Основна маса якось бажанням не горіла і по 8 ГБ в комп'ютери встановлювати (хоча це давно доступно), так що їй немає різниці - можна поставити 12 або як. Тим більше що зараз вже при двох модулях на канал двоканального контролера пам'яті можна отримати і 16 ГБ, а питання - наскільки це гірше/краще, ніж 24 ГБ, для нормального користувача комп'ютера схоже на питання, скільки ангелів помістяться на кінчику голки.

Разом

При погляді на підсумкову діаграму виникає закономірне питання - а навіщо ми всім цим займалися? Адже видно, що до фінішу практично всі дійшли одночасно. Гіпотетичний одноканальний режим свою відносну безглуздість показав, що двоканальний - як і можна було припустити з тестів у синтетиці, виявився найшвидшим. Розкид у 2% між кращим і найгіршим випадками на такій представницькій кількості додатків – дуже добрий результат. Показує, що, як би там не було, але переважно наша поточна методика тестування продовжує залишатися методикою тестування процесорів, і на загальний підсумковий бал інші характеристики системи впливають дуже слабо.

Але! Заспокоюватися на цьому рано - як ми бачимо, у загальному заліку вийшла ідилія саме через те, що різні додатки один одного врівноважують, проте поводяться вони зовсім по-різному. Комусь потрібно багато пам'яті, комусь її збільшення навпаки – заважає, комусь не важливий обсяг, але життєво важливі низькі затримки, але DivX, по суті, «знехтував» всі об'єктивно існуючі параметри пам'яті і віддав перевагу триканальному режиму в будь-якому вигляді. Тому, при порівнянні систем з різними конфігураціями пам'яті в рамках однієї статті (або самостійно), у конкретних тестах не варто забувати поцікавитись – як саме отримано той чи інший результат. Втім, не так довго залишилося нам возитися саме з різними конфігураціями - LGA1156, нагадаємо, підтримує лише два канали пам'яті, так що з цими процесорами все буде просто і логічно. Пристрої в конструктиві LGA1366 ми продовжимо тестувати в конфігурації 3х2, проте іноді будемо вилучати із запасників і 2х2 (коли небажано робитиме поправки в думці на особливості системи пам'яті). Можна було б навіть повністю перейти на останні, але немає сенсу – в середньому, вони, звичайно, дещо швидше, але підтримка трьох каналів пам'яті ексклюзивна особливість LGA1366, тож нехай за неї віддувається. Нам просто достатньо пам'ятати, що триканальний доступ до пам'яті на цій платформі продуктивність зовсім не збільшує, а навпаки.