GeForce RTX 4060 Ti 16G - Відеокарта з найкращим співвідношенням ціни та продуктивності для Stable Diffusion XL
By Stefani Tai|September 14,2023
Материнські плати
,
Відеокарти
,
Ігрова периферія
,
Десктопи
,
Монітори
,
Корпуси та інші компоненти
Протягом останніх кількох місяців ви, швидше за все, бачили пости в соціальних мережах, новини та відео про штучний інтелект і контент, який він може генерувати. Дітище OpenAI, ChatGPT, на сьогоднішній день є найбільш відомим. Його інтерфейс у стилі чату дозволяє користувачам взаємодіяти з моделлю штучного інтелекту: ставити запитання, доручати їй виконувати завдання, писати код і писати речення, абзаци або навіть цілі статті.
Окрім текстових моделей, таких як ChatGPT, з'явилися також більш візуальні форми ШІ-моделей, які можуть генерувати зображення на основі підказки (наприклад, MidJourney, Stable Diffusion, DALL-E тощо). Ви можете попросити ці моделі створити цифрове мистецтво на основі таких запитів:
Запити:
Space battleship, causing objects to disintegrate into atomic particles. cinematic shot + dynamic composition, incredibly detailed, sharpen, details + intricate detail + professional lighting, film lighting + 35mm + anamorphic + lightroom + cinematography + bokeh + lens flare + film grain + HDR10 + 8K + Roger Deakins, ((cinematic)), perfect composition, hyperrealistic, super detailed, 8k, high quality, trending art, trending on artstation, sharp focus, studio photo, intricate details, highly detailed
Негативні запити:
(3d, cartoon, anime, sketches), (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), bad anatomy, out of view, cut off, ugly, deformed, mutated, ((young)), EasyNegative, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,extra fingers,fewer fingers, (ugly eyes, deformed iris, deformed pupils, fused lips and teeth:1.2), (un-detailed skin, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.2), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions
За допомогою однієї з цих моделей ми отримали такий результат:
Зрозуміло, що отримання доступу до таких потужних інструментів перевернуло з ніг на голову цілі галузі. Хоча жодна модель штучного інтелекту і близько не може повною мірою замінити людину, коли мова йде про мистецтво, графіку, письмо і творчість в цілому, багато професій починають відчувати на собі вплив цих технологій.
Однак контент, створений штучним інтелектом, все ще використовується лише як допоміжний засіб для створення типового контенту (тексту, фрагментів коду, зображень або графіки), оскільки він часто може бути дуже впевнено помилковим щодо низки тем. Більше того, чат-бот Bard AI від Google припустився фактичної помилки під час першої ж демонстрації!
Тим не менш, їхня корисність з часом тільки зростатиме. Ми вже бачимо появу нових моделей ШІ, які значно кращі за попередні версії.
VRAM та ШІ-моделі: Скільки вам потрібно?
Деякі інструменти штучного інтелекту, доступні на сьогоднішній день, виділяються завдяки своєму відкритому коду, що надає користувачам, компаніям і організаціям можливість локально розміщувати ці моделі на своєму обладнанні без будь-яких проблем з конфіденційністю та безпекою.
Хоча великим компаніям не бракує інфраструктури або фінансування для самостійного розміщення цих моделей, приватні особи, які хочуть використовувати ШІ, можуть зіткнутися з проблемою. Однією з причин, чому моделі штучного інтелекту можуть працювати дуже повільно або навіть не підтримуватися на сучасному обладнанні, є вимоги до відеопам'яті (VRAM).
Мінімальні вимоги Stable Diffusion XL
Одним з таких прикладів є нещодавно випущена модель Stable Diffusion XL (SDXL) від Stability AI. Компанія описує її як "найдосконалішу" на сьогоднішній день.
Тепер він може генерувати покращені обличчя, розбірливий текст і більш естетичні зображення, використовуючи коротші підказки. Однак ці розширені можливості мають певні апаратні вимоги, зокрема, вимоги до відеопам'яті та продуктивності графічного процесора.
Отже, що саме вам потрібно, щоб насолоджуватися поліпшеннями SDXL на вашому комп'ютері в домашніх умовах?
По-перше, Stability AI рекомендує відеокарту Nvidia, тому ми будемо використовувати продукти поточного і попереднього поколінь, щоб краще зрозуміти, на яку продуктивність ви можете розраховувати. Хоча в опублікованому прес-релізі Stability AI вимагає мінімум 8 ГБ оперативної пам'яті, ми вирішили дослідити вплив більшого об'єму VRAM на продуктивність моделі.
Чи має мінімально сумісна система (або трохи краща) придатну для використання продуктивність, і чи може потужніший графічний процесор компенсувати нестачу VRAM?
Щоб відповісти на це питання, ми попросили нашу лабораторію протестувати роботу Stable Diffusion XL на відеокартах поточного та попереднього поколінь. Ці дані дозволять вам прийняти більш обґрунтоване рішення при покупці наступної відеокарти.
Бенчмарки SDXL GPU для відеокарт GeForce.
Для наших тестів ми використовуємо відеокарти RTX 4060 Ti 16 GB, RTX 3080 10 GB і RTX 3060 12 GB.
Почнемо з простої художньої композиції з параметрами за замовчуванням.
1024 x 1024
Обсяг відеопам'яті VRAM (ГБ)
Час викоання (с)
RTX 4060 Ti 16G
11.4 GB
16.0 с
RTX 3080 10G
9.7 GB
65.1 с
RTX 3060 12G
11.7 GB
27.2 с
Результати, ймовірно, здивують тих, хто зазвичай орієнтується лише на ігрові бенчмарки.
RTX 4060 Ti 16GB з 16 ГБ буфером VRAM легко випереджає інших із результатом 16 секунд для виконання завдання. На другому місці, завдяки 12 ГБ VRAM, RTX 3060 12 GB з часом 27,2 секунди. Це не супер, але все ще досить добре.
На жаль, нестача VRAM на RTX 3080 означає, що потужність графічного процесора стає марною і він працює дуже повільно - 65,1 секунди! Сучасна RTX 4060 Ti 16 GB знищує топову відеокарту попереднього покоління RTX 3080 з приблизно в 4 рази швидшим часом генерації зображень.
Бенчмарк SDXL: 1024x1024 + LoRA
Давайте трохи піднімемо ставки, гаразд? У наступному тесті ми спробуємо LoRA.
Методи LoRA або Low-Rank Adaptation дозволяють вам точно налаштувати моделі стабільної дифузії на певні художні стилі або персонажів. Однак це збільшує навантаження на вашу VRAM, тож давайте подивимося, як тут покажуть себе наші учасники.
Давайте використаємо LoRA, щоб згенерувати зображення "Кібердівчинки", щоб з'ясувати, наскільки великою може бути різниця між відеокартою з недостатньою кількістю VRAM і з її надлишком.
1024 x 1024 + LoRA
Обсяг відеопам'яті VRAM (ГБ)
Час викоання (с)
RTX 4060 Ti 16G
15.5 GB
17.0 c
RTX 3080 10G
9.6 GB
98.8 c
RTX 3060 12G
11.5 GB
26.8 c
Тут RTX 3080 значно поступається картам 60-го класу з більшим об'ємом VRAM. RTX 4060 Ti 16 GB знову лідирує, витрачаючи лише 17 секунд на створення зображення, в той час як RTX 3080 пасе задніх з показником 98,8 секунди.
SDXL Benchmarks: 1024x1024 + LoRA + ControlNet
Давайте зробимо це трохи складнішим для карток 60 класу за допомогою деяких додаткових умов, використовуючи ControlNet.
По-перше, що таке ControlNet? Простіше кажучи, це нейромережева модель, яку ви можете використовувати для подальшого контролю і точного налаштування композицій (виходів) Stable Diffusion. Вона дозволяє повідомити Stable Diffusion, чітке визначення бажаного дизайну, і додатково вдосконалити результат, щоб він краще відповідав вашим потребам.
Відвідайте сторінку ControlNet на GitHub для отримання більш детальної інформації та документації про те, як її налаштувати
1024 x 1024 + LoRA + controlnet
Обсяг відеопам'яті VRAM (ГБ)
Час викоання (с)
RTX 4060 Ti 16G
15.2 GB
48.7 c
RTX 3080 10G
9.7 GB
51 c
RTX 3060 12G
11.5 GB
89.2 c
RTX 3080 скорочує розрив з RTX 4060 Ti 16 GB і нарешті випереджає RTX 3060 12 GB. Однак навіть у цьому надважкому для обчислень сценарії RTX 4060 Ti 16 GB опиняється на вершині з помітним відривом.
Бенчмарк SDXL : 1024x1024 + Upscaling
Тепер давайте спробуємо додати трохи апскейлінгу. Чи зможуть наші учасники 60-го класу впоратися зі значним приростом потужності RTX 3080 після апскейлінгу? Для цих тестів ми будемо використовувати алгоритм Real Enhanced Super-Resolution Generative Adversarial Networks, або як він ще відомий – R-ESRGAN 4x+.
1024 x 1024 upscale x2
Обсяг відеопам'яті VRAM (ГБ)
Час викоання (с)
RTX 4060 Ti 16G
10.8 GB
5.5 c
RTX 3080 10G
10 GB
8.6 c
RTX 3060 12G
10.4 GB
7.8 c
При створенні зображення з роздільною здатністю 1024x1024, збільшеного в 2 рази, RTX 4060 Ti 16 GB випереджає як RTX 3080, так і RTX 3060 12 GB, витрачаючи на це всього 5,5 секунд, що на 36% швидше, ніж RTX 3080 10 GB..
1024 x 1024 upscale x4
Обсяг відеопам'яті VRAM (ГБ)
Час викоання (с)
RTX 4060 Ti 16G
10.5 GB
10 c
RTX 3080 10G
10 GB
13 c
RTX 3060 12G
10.4 GB
12.3 c
Прірва між RTX 4060 Ti 16 GB і конкурентами дещо скоротилася при використанні 4-кратного масштабування за допомогою апскалера R-ESRGAN 4x+. Тепер RTX 4060 Ti 16 GB на 23% швидше виконує завдання, ніж RTX 3080 10 GB, а RTX 3060 12 GB знаходиться поруч з RTX 3080. Тим не менш, RTX 4060 Ti 16 GB все ще зберігає лідерство.
Як ви можете бачити з цих останніх кількох результатів, чим інтенсивніше навантаження при масштабуванні, тим ближче RTX 3080 до конкурентів 60 класу.
Відеокарта з найкращим співвідношенням ціни та продуктивності для Stable Diffusion XL
Коли мова йде про такі моделі ШІ, як Stable Diffusion XL, важливо мати достатню кількість відеопам'яті VRAM. З наведеного вище тестування добре видно, що RTX 4060 Ti 16GB - це відеокарта з найкращим співвідношенням ціни та продуктивності для генерації зображень зі штучним інтелектом, яку ви можете купити прямо зараз.
Ви можете перейти на сторінку Stability AI на GitHub, щоб знайти більше інформації про SDXL та інші моделі дифузії від Stability AI.