Історія розвитку графіки Intel. Частина

У представлених у 2012 році процесорах 3 покоління Core під кодовою назвою Ivy Bridge Intel продовжила розпочату революцію вбудованої графіки. Усунули вузьке місце — низький філлрейт, додавши растрові і текстурні блоки — тепер їх стало 2 і 4 відповідно. Кількість шейдерних блоків збільшилася до 128, EU — до 16, було додано невеликий власний кеш для графічного процесора. Завдяки цим змінам HD4000 стала від півтора до двох разів швидшою за попередника. До того ж було внесено зміни до графічного конвеєра і додано блок тесселяції. Тепер вбудована графіка повністю підтримувала найсучасніші API — DirectX 11, OpenGL 4 і шейдери версії 5.0. Плюс до всього цього тепер вона обзавелася підтримкою декодування 4K-відео з кодеком AVC.

При цьому частота ядра знизилася на пару сотень МГц, а пам’ять на нових процесорах прискорилася лише трохи — стала підтримуватися DDR3-1600 зі смугою пропускання 25.6 Гб/c. Як і в минулому поколінні, для низки процесорів було застосовано спрощену версію графіки — вона отримала назву HD2500. Незважаючи на те, що блоків EU у ній було 6, як і в попереднику, завдяки архітектурним змінам вона могла бути відчутно швидшою за HD2000, майже нарівні з HD3000 — при тому, що деякі нові тайтли давалися новинці навіть краще.

У 2013 році, з виходом процесорів 4 покоління під кодовою назвою Haswell, Intel вкотре допрацювала вбудований ГП. Новинка отримала 160 шейдерних процесорів, об’єднаних у 20 EU. Прискорений удвічі кеш процесорів нової архітектури позитивно вплинув і на вбудовану графіку. Усе це призвело до збільшення продуктивності приблизно в півтора рази. У підсумку, HD4600 практично зрівнялася з дискретними картами рівня популярної бюджетної GeForce GT630, чого було достатньо для багатьох ігор на низьких налаштуваннях в HD-роздільній здатності. Незважаючи на відчутне підвищення продуктивності, кількість растрових і текстурних модулів залишилася незмінною, та й частота ядра теж залишилася колишньою. Максимальний обсяг пам’яті, доступний для графіки, був збільшений до 2048 Мб.

Конвеєр укотре було доопрацьовано, покращився блок тесселяції, додалася підтримка DirectX 11.1, пізніше — часткова для DirectX 12. Але найголовніше те, що пристрій графічної частини відтепер проєктувався від самого початку масштабованим по 10 EU з 80 шейдерними процесорами. Такий модуль Intel називає Subslice. У більш ранніх ГП для отримання молодшого варіанту графіки відключалися блоки. Тепер же можна було спочатку формувати на кристалі потрібну кількість таких «цеглинок», не витрачаючи транзисторний бюджет на відключену частину.

У Pentium і Celeron такий блок був один, в основній масі Core i3/i5/i7 — два, а в окремих мобільних моделях — цілих чотири. Остання версія отримала два різновиди: HD5000 і Iris 5100. Обидві мають 320 шейдерних процесорів, 40 EU, 4 ROP і 8 TMU. Починаючи з Haswell, Intel більше уваги стала приділяти продуктивності мобільної графіки, ніж десктопної. Як наслідок, деякі мобільні моделі стали отримувати продуктивну вбудовану графіку, аналогів якої у сокетних десктопних процесорів просто не було.

Для топових мобільних i7 і десктопних версій i5/i7, що розпаюються на платі, поруч із процесором було впроваджено додатковий кристал високошвидкісної пам’яті eDRAM об’ємом 128 Мб, який відігравав роль кеша 4 рівня. Крім процесора, цей кеш використовувався і вбудованою графікою, аналогічною за конфігурацією блоків HD5000 і Iris 5100. Вона отримала назву Iris Pro 5200. Завдяки додатковому швидкому кешу швидкість роботи порівняно з HD4600 подвоїлася і перебувала на рівні дискретної GeForce GT640. На жаль, у масових моделях вбудованих ГП Intel користувач не побачить такої продуктивності ще довго.

8 покоління — серія HD5500/Iris 6200

Наступне покоління процесорів Core під кодовою назвою Broadwell — п’яте. Воно отримало вкотре поліпшену графіку. Щоправда, десктоп цього разу залишився практично осторонь — для ПК було випущено тільки кілька моделей i5 і i7, а решта асортименту дісталася ноутбукам. Частота підтримуваної пам’яті залишилася колишньою — все та ж DDR3-1600.

Топова графіка Iris Pro 6200, яка тепер дісталася і рідкісним десктопним моделям, стала еволюційним розвитком Iris Pro 5200. Її базовою «цеглинкою» став дрібніший модуль Subslice з 8 EU і 64 шейдерних процесорів. Загальна кількість шейдерів збільшилася незначно — з 320 до 384, але текстурний і піксельний філрейт доволі сильно підросли. Це стало можливим завдяки подвоєнню растрових і текстурних блоків. У Iris Pro 6200 їх стало 8 і 16 відповідно. Нікуди не подівся і швидкий кеш eDRAM об’ємом 128 Мб, що підвищує продуктивність. Такий набір усунув слабкі місця і дозволив новій графіці місцями досить близько підійти до рівня дискретної GeForce GTX650.

Однак Iris Pro 6200 спіткала та ж доля, що і її попередника в особі Iris Pro 5200 — мала поширеність. Десктопні процесори Broadwell були рідкісними і дорогими, а в мобільних така графіка встановлювалася хіба що в топові i7. Деякі ноутбучні моделі отримали HD6000 і Iris Graphics 6100 з такими ж характеристиками, але без eDRAM кешу.

При всіх перевагах графіки Iris, основна маса мобільних процесорів п’ятого покоління обмежилася набагато простішими HD Graphics 5300/5500, які були «половинкою» старшої моделі. Вона включає в себе 192 шейдерних блоки, 24 EU, 4 блоки растрових операцій і 8 текстурних юнітів. Продуктивність цих моделей недалеко пішла від HD Graphics 4600 — середня перевага становила всього близько чверті, а то й менше.

Графіка в нечисленних бюджетних моделях Pentium і Celeron і такого відриву від своїх попередників не показувала — незважаючи на 96 шейдерів проти старих 80, її частоти знизили на чверть, через що найчастіше спостерігався паритет між старим і новим поколінням. При цьому навіть старші рішення за межі 1150 МГц за ядром так і не вийшли, опинившись за цим параметром аналогічними двом попереднім поколінням графіки.

9 покоління — серії HD, UHD і Iris 500/600

Наприкінці 2015 року, після приходу 6 покоління процесорів Core під кодовою назвою Skylake, Intel на кілька років практично перестала розвивати як процесорну архітектуру, так і графічну. Масова графіка мобільних Broadwel — HD5500 — практично без змін перекочувала в процесори Skylake, змінивши ім’я на HD520/530. Ті самі 192 шейдери, 24 виконавчі блоки, 4 ROP і 8 TMU, аналогічні робочі частоти. Найбільші відмінності лише в повноцінній підтримці DirectX 12, Open GL 4.6 і Vulkan, а також новому декодері для відео формату HEVC.

Завдяки новим драйверам вбудоване відео тепер могло використовувати до половини системної пам’яті — щоправда, реально така можливість вбудованій графіці в більшості випадків була ні до чого. Пропускна здатність збільшилася через нову пам’ять DDR4: тепер це значення могло досягати 34.1 Гб/c. При цьому сокетні десктопні моделі продуктивніших версій графіки не отримали, що було кроком назад порівняно з попередником Broadwell. Як наслідок, незважаючи на збільшену кількість растрових блоків, текстурних юнітів і нову пам’ять, продуктивність масової графіки HD530 все так само тупцювала поруч із позаторішньою HD4600.

Молодші Pentium і Celeron обмежилися урізаною версією під назвою HD 510, яка була половинкою старшого брата за всіма робочими блоками. Нечисленні моделі Iris Graphics 540/550, що поширювалися в деяких мобільних моделях, були копією Iris Pro 6200 зі зменшеним до 64 Мб об’ємом пам’яті eDRAM. Обійти вони свого прямого попередника не змогли, але показували продуктивність приблизно на його рівні.

Окремо стояла нова Iris Pro 580, що вийшла, по суті, півторакратним масштабуванням Iris Pro 6200 — цілих 576 шейдерних процесорів в 72 виконавчих блоках, 12 ROP і 24 TMU. Не пошкодували для неї і повноцінний кеш eDRAM об’ємом 128 Мб. Все це робило Iris Pro 580 новим рекордсменом продуктивності серед вбудованої графіки Intel. Однак у реальних пристроях вона зустрічалася винятково рідко — тільки в топових мобільних i7, де в пару процесору зазвичай ставили дискретну графіку, або в деяких дорогих моноблоках з розпаяними процесорами. За продуктивністю така графіка в певних випадках може дотягнутися навіть до GeForce GTX750, але через непоширеність у реальних пристроях практичного сенсу в ній було небагато.

Графіка, вбудована в масові процесори 7 покоління Kaby Lake, змін не зазнала, лише змінивши назву на HD620/630. Завдяки новому контролеру пам’яті процесорів збільшилася хіба що пікова пропускна здатність — з 34.1 до 38.4 Гб/c. Молодші моделі отримали перейменовану HD510 у вигляді HD610. Варіації Iris змінили приставку Pro на Plus: 540 модель стала іменуватися Iris Plus 640, 550 — Iris Plus 650. Наступника Iris Pro Graphics 580 у цьому поколінні не було — найімовірніше тому, що процесори з такою графікою виходили надто дорогими, і без дискретної графіки однаково майже ніде не використовувалися.

З приходом 8 покоління процесорів Coffee Lake у 2017 році, назву HD Graphics було змінено на Ultra HD Graphics — для підкреслення можливості роботи з відео високої роздільної здатності та відповідними моніторами. HD630 стала UHD630, HD610 — UHD610. Було розширено роботу з відеокодеками, а підтримувана швидкість пам’яті вкотре підвищилася, забезпечивши пропускну здатність у 42.7 Гб/c. І, загалом-то, все. У такому ж вигляді вона перекочувала в масові процесори 9 і 10 покоління без будь-яких змін. Сама Intel відносить UHD до покоління 9.5, але нововведень у самому графічному процесорі або підтримуваних API з часів Skylake так і не було.

11 покоління — серія UHD/Iris Plus

Незважаючи на те, що десктопні процесори 10 покоління вироблялися за старими 14 нм нормами, мобільні моделі було вирішено перевести на більш сучасні 10 нм. Тим більше, що ноутбуки потребували більш швидкої вбудованої графіки набагато більше, ніж десктопи. Саме тому ці процесори, які отримали кодове ім’я Ice Lake, стали пробою пера для чергового покоління графіки — одинадцятого. При цьому цифру «10» у поколіннях графіки вирішено було перестрибнути.

У нову лінійку вбудованих ГП входило три моделі: дві Iris Plus і одна UHD. Старша має 512 шейдерних процесорів (64 EU), середня 384 (48 EU), молодша — 256 (32 EU). Від кристала eDRAM, який значно збільшував ціну кінцевих продуктів, вирішено було повністю відмовитися. Було додано сумісність із DirectX 12.1 і підтримку затінення зі змінною швидкістю, проведено оптимізацію, збільшено пікову пропускну спроможність пам’яті платформи — під час використання найшвидшої пам’яті це значення доходить до 59.7 Гб/c. Це дало змогу збільшити продуктивність — старша модель наздоганяє старі Iris із 48 виконавчими блоками та eDRAM кешем, і в низці випадків здатна наблизитися до дискретної GeForce GT1030.

Зазнали змін як набір інструкцій ГП, так і внутрішня конфігурація блоків: тепер 2 ROP і 4 TMU припадають не на 96 шейдерних процесорів, а на 128. У підсумку, старша модель володіє все тими ж 8 ROP і 16 TMU, що і минулі моделі Iris, за винятком топової на свій час Iris Pro 580. Але це тільки початок кардинальних змін. Все найцікавіше чекає на графіку Intel у наступному, 12 поколінні.

12 покоління — серія Xe

Насправді, робота над 11 поколінням графіки була лише підготовкою до чогось масштабнішого. Ще 2019 року Intel оголосила про розробку нової графічної архітектури, яка в майбутньому стане основою як дискретних, так і вбудованих графічних рішень. Вона отримала назву Intel Xe і мала містити кілька варіацій для різного обладнання: Xe-LP для вбудованої графіки, Xe-HP для центрів обробки даних, Xe-HPC для прискорювачів обчислень, і Xe-HPG для високопродуктивних дискретних графічних процесорів.

Перше покоління Xe-LP дебютувало з виходом 11 покоління процесорів Core під кодовою назвою Rocket Lake. Було подвоєно кількість блоків растрових і текстурних операцій — тепер 2 ROP і 4 TMU припадають на кожен блок Subclice, а не на пару, як раніше. За рахунок цього філлрейт нової вбудованої графіки збільшився вдвічі.

Для дектопних процесорів представили два різновиди — UHD750 з 256 шейдерними процесорами і 32EU і злегка урізану UHD730 з 192 шейдерами і 24 EU. Пропускна здатність пам’яті на десктопі обмежилася значенням 51.2 Гб/c, а стеля частоти ядра піднялася до 1300 МГц. Через невелику кількість шейдерів, продуктивність старшої моделі порівняно зі старою HD530/630 збільшилася не так сильно — трохи більше, ніж на третину. З молодшою моделлю різниця у попередника ще менша.

А ось мобільні версії, як і раніше, отримали більше виконавчих блоків. Причому, цього разу ще істотніше — під різними версіями Iris Xe Graphics у ноутбучних процесорах ховаються дві варіації графіки, що мають 640 шейдерів у 80 EU і 768 шейдерів у 96 EU. Відповідно до нової ієрархії співвідношення блоків, старша версія має 24 ROP і 48 TMU, молодша — 20 ROP і 40 TMU, що нарешті стало першим істотним стрибком аж з часів рідкісного Iris Pro 580 кінця 2015 року. Пікова пропускна здатність пам’яті на мобільній платформі зросла до 68.2 Гб/c, що теж позитивно вплинуло на продуктивність. Усе це дало змогу графіці йти на рівних із сучасними дискретними мобільними відеокартами початкового рівня — такими, як GeForce MX350.

Один із різновидів Iris Xe встановлюється в усі мобільні процесори цього покоління, за винятком Pentium і Celeron. Останні отримали урізану версію під назвою UHD Graphics, яка при цьому все одно швидша за десктопну UHD750. Вона містить 384 шейдерні процесори, згруповані в 48 EU.

Пізніше на основі однієї з конфігурацій блоків вбудованої ноутбучної Iris Xe була випущена перша з 1998 року дискретна карта Intel — Iris Xe DG1. Володіючи власною пам’яттю 4Гб LPDDR4X із пропускною спроможністю 68.2 Гб/c, карта виявилася дещо продуктивнішою за GeForce GT1030 — найчастіше на рівні зі швидшою Radeon RX550. Такі ж характеристики має мобільний різновид дискретної Iris Xe DG1 у ноутбуках — там вона носить ім’я Iris Xe Max.

У 2022 році в 12 поколінні процесорів Alder Lake архітектурно графіка не змінилася. Старша версія стала називатися UHD 770, обзавівшись частотою ядра до 1500 МГц і підтримкою нової памʼяті DDR5 із пропускною спроможністю до 76.8 Гб/c. Додався молодший варіант UHD 710, у якому всього 128 шейдерних блоків — він знайшов застосування в нових Pentium і Celeron. Також став доступний проміжний варіант UHD з 512 шейдерами для мобільних процесорів.

Перша ітерація архітектури Xe-HPG, призначена для продуктивних карт, отримала назву Alchemist. Блоки продуктивного варіанту архітектури зазнали змін порівняно з тими, які використовуються у вбудованій графіці. У кожному новому базовому блоці 128 шейдерних процесорів і 16 EU. До нього прив’язані 4 растрових і 8 текстурних модулів, а також одне спеціалізоване ядро для трасування променів.

Серед десктопних карт у світ вийшла поки тільки молодша модель — Arc 3 A380, у якій таких блоків 8. Разом вони утворюють 1024 шейдерних процесори в 128 EU, 32 ROP і 64 TMU. Пам’ять GDDR6 з’єднується з ГП за 96-бітною шиною і має пропускну здатність 186 Гб/c. Карта вже здатна досягти продуктивності сучасних бюджетних GeForce GTX1650 або Radeon RX6400, але в деяких проєктах результати нестабільні — дається взнаки сирість драйверів, які компанія обіцяє «допилити» до кінця року. Мобільні версії чіпа під назвами A370M і A350M показують результати нижчі: перший урізаний тільки за частотою, а другий — ще й за шейдерними блоками, там їх усього 768. При цьому в обох набагато менша пропускна здатність через застосування вужчої 64-бітної шини — всього 112 Гб/c.

У третьому кварталі року готуються до виходу старші карти Alchemist. Це Arc 5 — A580 і A550M, а також топові Arc 7 — A770, A770M і A730M. Старша версія матиме 4096 шейдерних процесорів, згрупованих у 512 EU, 128 ROP і 256 TMU, 64 блоки RT і 16 Гб 256-бітної GDDR6 памʼяті з пропускною спроможністю 512 Гб/c. Решта версій отримають ГП з меншою кількістю блоків, об’ємом пам’яті та її пропускною спроможністю. Очікувана продуктивність флагмана на старті — приблизно на рівні RTX 3060 Ti.

Майбутні покоління

На презентації нового сімейства дискретної графіки Intel оголосила, що вже працює над наступними поколіннями графіки Xe і навіть назвала їхні кодові імена: після Alchemist слідують Battlemage, потім Celestial, і, нарешті, — Druid.

Компанія серйозно налаштована розвивати дискретну графіку в майбутньому, за що можна пробачити їй перші «млинці грудкою» у вигляді недопрацьованих драйверів Alchemist на виході. Зараз Intel займається оптимізацією нової графіки, але при цьому говорить відверто: архітектура Xe найкраще справляється з проектами на сучасному DirectX 12. У випадку зі старими іграми, що використовують минулі версії DirectX, продуктивність буде трохи нижчою за конкурентів. Утім, у старих проєктах продуктивності Xe і так найчастіше достатньо, тому наголос на сучасний API для нових моделей карт у 2022 році не виглядає дивно.

На жаль, початкові плани Intel вийти на ринок на рівних із субфлагманами NVIDIA і AMD, найімовірніше, вже не збудуться. Але до середніх рішень лінійка карт Alchemist цілком зможе дотягнутися, що теж непогано для виходу на ринок дискретних моделей вперше за стільки років. Не варто забувати, що вже наступного року Intel обіцяє нам друге покоління карт Xe — Battlemage, які, найімовірніше, врахують минулі помилки і порадують вищою продуктивністю. А поки світ завмер в очікуванні старших карт сімейства Alchemist, які побачать світ уже зовсім скоро.