Як Tesla застосовує симульовані дані для вдосконалення FSD

Tesla нещодавно запустила FSD у Китаї, що змусило багатьох задуматися, як їм вдалося це зробити так швидко. Tesla не має права передавати навчальні дані за межі Китаю, тому вона не може використовувати потужності нового Cortex Supercomputer Cluster на Giga Texas.

Натомість Tesla використовує свій універсальний алгоритм разом із синтетичними навчальними даними для підготовки FSD для Китаю. Звісно, ця ж синтетична інформація доповнює тренування для Північної Америки та Європи. І з європейським FSD на горизонті, ми, ймовірно, побачимо зростання застосування синтетичних даних для обробки крайніх випадків.

Симульований контент

Tesla офіційно називає синтетичні навчальні дані «Simulated Content» у всьому своєму патенті «Vision-Based System Training with Synthetic Content». Пояснимо це простішими словами.

Як відомо, підхід Tesla до автономії базується на використанні Tesla Vision. Це означає, що основним — і фактично єдиним — джерелом даних про навколишнє середовище є камери. Радар більше не застосовують, а LiDAR служить лише для перевірки точності сенсорів зору під час тренувань.

Захоплення всієї інформації навколо автомобіля формує 3D-середовище, яке машина використовує для планування маршруту та прийняття рішень. Усі дані обробляються, щоб створити детальне уявлення про поточні та майбутні об’єкти навколо авто, яке також тегується та характеризується для пріоритизації рішень системою.

Tренування FSD у Tesla здійснюється за допомогою supervised learning model. Це означає, що модель отримує вже позначені дані, створені людьми або за допомогою унікальної AI-системи Tesla. Об’єкти на зображеннях визначаються та маркуються з позицією, швидкістю й прискоренням — це слугує ground truth для навчання AI.

Ground truth label data є критично важливим етапом у цьому процесі. Позначені дані надають моделі точну інформацію про об’єкти та їх характеристики. Це дозволяє Tesla створити надійне розуміння оточення FSD під час руху. Зазвичай ці дані збирають із реальних умов і анотируют вручну або автоматично.

Доповнюючи реальні позначені дані, Tesla використовує систему, що генерує синтетичні навчальні дані — ключовий елемент цього патенту. Вона створює штучний контент, близький за характеристиками до ground truth.

Виробництво такого контенту контролюється атрибутами моделі контенту — content model attributes, які витягують ключові особливості з ground truth, такі як краю дороги, смуги руху, статичні й динамічні об’єкти.

Змінюючи ці атрибути, система формує широкий спектр симульованих сценаріїв — це дає FSD досвід різноманітних та нормальних ситуацій.

Окрім атрибутів, система додає контекстуальне маркування, де до симульованого контенту додають деталі: погодні умови, час доби чи тип дороги — це допомагає покращити розуміння середовища.

Система генерує величезні обсяги даних, створюючи варіації моделей контенту: зміна атрибутів об’єктів, умов навколишнього середовища або введення нових ситуацій, як-от інтенсивний рух чи будівництво.

Підсумовуючи — комбінований набір реальних і симульованих даних використовується для тренування FSD. Завдяки постійному надходженню обох типів даних Tesla безперервно удосконалює FSD.

Підписка на Telegram EVS Car канал