Розв’язання задач штучного інтелекту в реальному світі — будь то автономне водіння, робототехніка чи просунуті методи мислення — вимагає майже неймовірних обчислювальних потужностей. Щоб відповісти на цей виклик, Tesla розробляє власне апаратне забезпечення для навчання ШІ, водночас купуючи обладнання на відкритому ринку.
Тепер чіп нового покоління Dojo 2, як повідомляють джерела, запущений у масове виробництво на фабриках найбільшого в світі виробника напівпровідників TSMC. Хоча деякі можуть сприймати це як побічне завдання, збільшення обчислювальних потужностей Tesla є необхідною умовою для досягнення екзафлопсівної обчислювальної потужності, що є ключовим для всіх AI-амбіцій компанії.
Ілон Маск назвав Dojo 2 «гарним комп’ютером», а потім пожартував про продуктивність: цей чіп може запускати Crysis з мільярдом кадрів за секунду.
Екзафлопс-ШІ: FSD, Optimus та інше
Хоча досі Tesla успішно використовувала потужні GPU сторонніх виробників для навчання моделей, суперкомп’ютер Dojo — це рішення з нуля, орієнтоване на конкретне застосування. Воно дозволяє ефективно обробляти величезні обсяги відеоданих для навчання нейронних мереж. Сам чіп Dojo 2 є ключем, що відкриває цей потенціал.
Dojo 2 буде навчати нейронні мережі на основі візіонерських даних, від яких залежить FSD, що дозволить Tesla ще швидше обробляти відео з її величезного світового автопарку. Поки Tesla удосконалює FSD, однією з найбільших проблем залишається обробка відео для відпрацювання складних граничних випадків.
Сотні тисяч миль тренувальних даних можуть бути зібрані, перш ніж буде виявлено і навчене нове граничне випадок, але їх усі потрібно аналізувати, маркувати та обробляти, що є ключовим для роботи Dojo 2. Кожен новий корисний фрагмент тренувальних даних допомагає Tesla просуватись вперед у марші дев’яток, поступово покращуючи FSD.
Цей процес вимагає грандіозних обчислювальних ресурсів і часу на навчання, але є абсолютною необхідністю для вдосконалення FSD. Ідеться не лише про FSD у автомобілях — гуманоїдний робот Tesla Optimus також використовує FSD для орієнтації та взаємодії з навколишнім середовищем.
Хоч це й кастомізована версія FSD, в основі вона залишається FSD, тобто ті ж нейронні мережі, що аналізують довкілля і створюють 3D-карту світу для вашого авто, виконують аналогічні завдання для Optimus.
Індивідуальний підхід до апаратного забезпечення ШІ
Потужність Dojo 2 полягає не тільки в обчислювальних можливостях; її забезпечують низка архітектурних рішень, що роблять його ефективнішим для навчання FSD і відрізняють від універсального обладнання та інших AI-спеціалізованих рішень.
Для досягнення цього Tesla застосовує нову технологію пакування TSMC — Integrated Fan-Out з Silicon-on-Wafer (InFO-SoW). При великих навантаженнях AI найчастішими вузькими місцями є тепловиділення і швидкість передачі даних між кристалами.
Нова технологія пакування забезпечує високошвидкісні канали зв’язку безпосередньо між кристалами, що знижує затримки та значно покращує відведення тепла — ключові фактори для створення масивних і щільних кластерів обчислювальної техніки.
На відміну від універсальних процесорів, Dojo 2 спроектовано з власним набором інструкцій, спеціально оптимізованим для навчання FSD. Його ядра прискорюють саме ті математичні операції, як-от множення матриць та систолічні масиви, що становлять основу візіонерських нейронних мереж Tesla.
Створивши власне обладнання, Tesla інтегрує своє програмне забезпечення та компілятори безпосередньо з кремнієм, оптимізуючи під конкретні навантаження та уникаючи втрат продуктивності, які можуть виникати при використанні сторонніх рішень, наприклад Nvidia CUDA.
Запуск Dojo 2 може здаватися побічним завданням, але насправді це важлива віхи для AI-технологій Tesla, що дає їй перевагу перед конкурентами, які використовують готові рішення. Щоб пришвидшити розвиток FSD, Tesla має продовжувати інвестувати в індивідуальне обладнання, замість того щоб рухатися зі льодовиковою швидкістю, яку ми спостерігали останні місяці.