Штучний інтелект та шифрування технології ведуть до перетворення індустрії Ботів Модель VLA відкриває нову еру автоматизації

Значний прорив у сфері Ботів: Шифрування та AI ведуть до нової епохи автоматизації

Швидкий розвиток штучного інтелекту переосмислює очікування людей від Ботів. З початком взаємодії великих мовних моделей із зовнішнім світом багато хто вважає, що AI-агенти досягли свого піку. Однак, якщо ми поглянемо на класичні науково-фантастичні твори, ми виявимо, що людство насправді прагне до гуманоїдних Ботів, які можуть взаємодіяти у фізичному світі.

Експерти в галузі вважають, що в сфері Ботів незабаром відбудеться значний прорив, подібний до ChatGPT. У цій статті спочатку буде проаналізовано, як технології ШИ змінили галузевий ландшафт в останні роки, а потім буде досліджено, як технічні досягнення в батареях, затримках і зборі даних формуватимуть майбутнє, а також роль шифрування в цьому процесі. Нарешті, ми зосередимося на ключових сферах безпеки Ботів, фінансування, оцінки та освіти.

Боти"ChatGPT момент":AI та шифрування технології, що ведуть до автоматизаційної революції

1. Ключові фактори трансформації

(1) Прорив у штучному інтелекті

Прогрес багатомодальних великих мовних моделей надає Ботам необхідний "мозок" для виконання складних завдань. Боти в основному сприймають навколишнє середовище через зір і слух.

Традиційні моделі комп’ютерного зору добре справляються з виявленням і класифікацією об’єктів, але їм важко перетворити візуальну інформацію на цілеспрямовані команди дій. Великі мовні моделі, хоча й демонструють відмінні результати в розумінні та генерації тексту, мають обмежені можливості сприйняття фізичного світу.

За допомогою моделі VLA(, що об'єднує зорове сприйняття, мовне розуміння та дії в єдиній обчислювальній рамці, Боти можуть інтегрувати ці три елементи. У лютому 2025 року одна з компаній з розробки ШІ представила універсальну модель керування гуманоїдними Ботами Helix, яка встановила нові стандарти для галузі завдяки своїй здатності до нульової генералізації та двосистемній архітектурі. Характеристика нульової генералізації дозволяє Ботам адаптуватися до нових сцен, нових об'єктів і нових інструкцій без повторного навчання для кожного завдання. Двосистемна архітектура розділяє високорівневе міркування та легковагове міркування, що забезпечує комерційним гуманоїдним Ботам як людське мислення, так і точність у реальному часі.

) ###2( Економічні Боти стали реальністю

Технології, які змінюють світ, мають одну спільну рису — доступність. Смартфони, персональні комп'ютери, 3D-друк стали доступними завдяки цінам, які можуть собі дозволити представники середнього класу. Коли ціна деяких Боти опуститься нижче вартості середньостатистичного автомобіля або мінімального річного доходу в США, уявлення про світ, де фізична праця та повсякденні справи в основному виконуються Ботами, вже не буде таким недосяжним.

) ###3( З переходом від складу до споживчого ринку

Технології Ботів розширюються з рішень для складу на споживчі сфери. Наш світ створено для людей — люди можуть виконувати всі роботи, які виконують професійні Боти, але професійні Боти не можуть впоратися з усіма людськими роботами. Компанії Ботів більше не обмежуються виробництвом роботів для фабрик, а переходять до розробки більш універсальних гуманоїдних Ботів. Тому передові технології Ботів існують не лише на складах, але й проникають у повсякденне життя.

Вартість є одним з основних вузьких місць масштабованості. Найважливіший показник — це загальна вартість на годину, яка розраховується як сума альтернативних витрат часу на навчання та заряджання, витрат на виконання завдань та витрат на придбання Ботів, поділена на загальний час роботи Ботів. Ця вартість повинна бути нижчою за середній рівень заробітної плати в галузі, щоб бути конкурентоспроможною.

Щоб повністю проникнути в сферу складування, загальні витрати на Боти повинні бути меншими за 31,39 доларів на годину. А в найбільшому споживчому ринку — приватній освіті та сфері охорони здоров'я, ці витрати повинні бути нижчими за 35,18 доларів. Наразі Боти розвиваються в напрямку більшої дешевизни, ефективності та універсальності.

![Боти"ChatGPT момент" : AI та шифрування технології, що рухають автоматизаційну революцію])https://img-cdn.gateio.im/webp-social/moments-dad05928d3bd80812cc8f0b2b8e11e69.webp(

2. Наступний прорив у технології Ботів

) ###1( оптимізація батареї

Технології акумуляторів завжди були вузьким місцем для дружніх до користувача Ботів. Ранні електромобілі через обмеження акумуляторних технологій мали короткий запас ходу, високу вартість і низьку практичність, що ускладнювало їхнє поширення; Боти стикаються з тією ж проблемою. Деякі відомі Боти мають запас ходу лише від 90 хвилин до 2 годин. Користувачі очевидно не бажають вручну заряджати пристрій кожні дві години, тому автономна зарядка та інфраструктура підключення стають пріоритетними напрямками розвитку. Наразі зарядка Ботів здійснюється в основному за двома режимами: заміна акумулятора або безпосередня зарядка.

Режим заміни батареї забезпечує безперервну роботу шляхом швидкої заміни виснажених батарейних блоків, максимізуючи час безвідмовної роботи, що підходить для польових або заводських умов. Цей процес можна виконувати вручну, а також автоматизувати.

Індукційна зарядка використовує бездротовий спосіб живлення, хоча повна зарядка займає більше часу, але вона може легко реалізувати повністю автоматизований процес.

) ###2( оптимізація затримки

Низькозатратні операції можна поділити на дві категорії: чутливість до середовища та віддалене керування. Чутливість стосується просторової пізнавальної здатності Боти до навколишнього середовища, тоді як віддалене керування стосується реального контролю оператором.

Дослідження показують, що системи сприйняття Ботів починаються з дешевих датчиків, але технологічний бар'єр полягає в програмному забезпеченні для інтеграції, енергоефективних обчисленнях та контролю витрат у мілісекундах. Коли Боти завершують просторову локалізацію, легка нейронна мережа позначає елементи, такі як перешкоди, піддони або люди. Коли етикетки сцени вводяться в планувальну систему, миттєво генеруються команди для двигунів, які надсилаються до ступень, колісних груп або маніпуляторів. Затримка сприйняття менше 50 мілісекунд еквівалентна швидкості рефлексів людини — будь-яка затримка, що перевищує цей поріг, призводить до незграбності рухів Ботів. Тому 90% рішень повинні прийматися локально через єдину мережу зорово-мовленнєвої-дійової.

Повністю автономні Боти повинні забезпечити низьку затримку VLA-моделі менше 50 мілісекунд; для віддаленого керування Ботами вимога полягає в тому, що затримка сигналу між робочою станцією та Ботом не повинна перевищувати 50 мілісекунд. Тут особливу важливість набуває VLA-модель — якщо візуальний та текстовий ввід обробляються різними моделями, а потім вводяться в велику мовну модель, загальна затримка значно перевищить поріг у 50 мілісекунд.

) ###3( Оптимізація збору даних

Збір даних має три основні способи: відеодані з реального світу, синтетичні дані та дані віддаленого керування. Основною перешкодою між реальними даними та синтетичними є розрив між фізичною поведінкою Ботів та відео/модельними симуляціями. Реальні відеодані не містять фізичних деталей, таких як зворотний зв'язок, помилки руху суглобів і деформація матеріалів; синтетичні дані ж не враховують непередбачувані змінні, такі як збої сенсорів, коефіцієнт тертя тощо.

Найбільш перспективний спосіб збору даних — це дистанційне керування — коли оператори дистанційно контролюють Боти для виконання завдань. Але витрати на працю є основним обмежуючим фактором збору даних за допомогою дистанційного керування.

Розробка спеціалізованого апаратного забезпечення також забезпечує нові рішення для якісного збору даних. Деякі компанії поєднують традиційні методи з спеціалізованим апаратним забезпеченням для збору багатовимірних даних про рухи людини, які після обробки перетворюються на набори даних, придатні для навчання нейронних мереж Ботів, в поєднанні з швидким циклом ітерації, що забезпечує величезну кількість якісних даних для навчання AI Ботів. Ці технологічні канали спільно скорочують шлях від сирих даних до розгорнутого Бота.

![Боти"ChatGPT момент": AI та шифрування технологій, які спричиняють автоматизаційну революцію])https://img-cdn.gateio.im/webp-social/moments-51e9de0e57c07ff5b7e3a52d204ecce0.webp(

3. Основні сфери дослідження

) ###1( шифрування технології та Боти

Технології шифрування можуть стимулювати недовірених сторін підвищувати ефективність мережі Ботів. На основі раніше згаданих ключових областей, технології шифрування можуть підвищити ефективність у трьох аспектах: інтеграція інфраструктури, оптимізація затримки та збір даних.

Децентралізована мережа фізичної інфраструктури ) DePIN ( має потенціал революціонізувати інфраструктуру зарядки. Коли людино-машини будуть працювати по всьому світу, зарядні станції повинні бути так само доступними, як і автозаправні станції. Централізовані мережі потребують величезних початкових інвестицій, тоді як DePIN розподіляє витрати серед операторів вузлів, що дозволяє швидко розширювати зарядні об'єкти на більше територій.

DePIN також використовує розподілену інфраструктуру для оптимізації затримки віддаленого керування. Агрегуючи географічно розподілені обчислювальні ресурси периферійних вузлів, інструкції віддаленого керування можуть оброблятися локальним або найближчим доступним вузлом, мінімізуючи відстані передачі даних і значно зменшуючи затримку зв'язку. Однак поточний проект DePIN в основному зосереджений на децентралізованому сховищі, розподілі контенту та спільному використанні пропускної здатності, хоча деякі проекти демонструють переваги застосування периферійних обчислень у потокових медіа або Інтернеті речей, але поки що не поширюються на сферу робототехніки чи дистанційного керування.

Віддалене керування є найбільш перспективним способом збору даних, але централізовані сутності наймають професіоналів для збору даних за дуже високою ціною. DePIN вирішує цю проблему, заохочуючи третіх осіб надавати дані віддаленого керування за допомогою шифрувальних токенів. Деякі проекти створюють глобальну мережу віддалених операторів, перетворюючи їх внесок на токенізовані цифрові активи, формуючи децентралізовану систему без дозволів — учасники можуть отримувати прибуток, брати участь в управлінні та допомагати в навчанні AGI Боти.

) ###2( Безпека завжди є основним занепокоєнням

Технічна мета робототехніки полягає в досягненні повної автономії, але людство найбільше не хоче бачити, як автономність перетворює роботів на агресивну зброю. Проблеми безпеки великих мовних моделей викликали занепокоєння, а коли ці моделі отримують здатність до фізичної дії, безпека роботів стає ключовою передумовою для соціального прийняття.

Економічна безпека є одним із стовпів процвітання екосистеми Ботів. Деякі компанії в цій сфері створюють децентралізований рівень координації машин, реалізуючи ідентифікацію пристроїв, перевірку фізичної присутності та отримання ресурсів за допомогою шифрування. На відміну від простого управління ринком завдань, ці системи дозволяють Ботам автономно підтверджувати інформацію про ідентичність, геолокацію та поведінкові записи без залежності від централізованих посередників.

Обмеження поведінки та ідентифікація виконуються через механізми на блокчейні, що забезпечує можливість аудиту відповідності для всіх. Боти, що відповідають стандартам безпеки, вимогам якості та регіональним нормам, отримають винагороду, тоді як порушники ризикують бути покараними або позбавленими права на участь, що сприяє створенню механізму підзвітності та довіри в мережі автономних машин.

Третя сторона повторного заставлення мережі також може надати рівнозначні гарантії безпеки. Незважаючи на те, що система параметрів покарання все ще потребує вдосконалення, відповідні технології вже перейшли в практичну стадію. Очікується, що галузеві стандарти безпеки незабаром будуть сформовані, і в той час параметри покарання будуть змодельовані відповідно до цих стандартів.

4. Заповнення прогалин у технологічному стеку Ботів

На відміну від AI, в галузі Ботів важко почати при обмежених фінансах. Щоб досягти поширення Ботів, поріг їх розробки необхідно знизити до такої ж зручності, як і в розробці додатків AI. Ми вважаємо, що існує простір для покращення на трьох рівнях: механізм фінансування, система оцінювання та освітня екосистема.

Фінансування є болючою точкою у сфері Ботів. Розробка комп'ютерних програм вимагає лише одного комп'ютера та ресурсів хмарних обчислень, тоді як створення функціонального робота вимагає закупівлі моторів, датчиків, батарей та іншого апаратного забезпечення, що легко перевищує 100 тисяч доларів. Ця апаратна природа робить розробку роботів менш гнучкою та дорогою в порівнянні з AI.

Інфраструктура оцінки Ботів у реальних сценаріях все ще на стадії зародження. У сфері AI вже встановлено чітку систему функцій втрат, тестування можна повністю віртуалізувати. Але відмінні віртуальні стратегії не можуть бути безпосередньо перетворені на ефективні рішення в реальному світі. Боти повинні мати можливість тестувати оцінні засоби автономних стратегій у різноманітних реальних середовищах, щоб досягти ітеративної оптимізації.

Коли ця інфраструктура дозріє, до галузі приваблять велику кількість талантів, і людино-подібні Боти повторять спалахову криву Web2. Деякі компанії рухаються в цьому напрямку — їхні проекти з відкритим кодом перетворюють первинне обладнання на економічно свідомі модульні інтелекти. Модулі візуалізації, мови та планування рухів можуть підключатися до системи, як мобільні додатки, всі етапи розумування представлені зрозумілою англійською мовою, що дозволяє операторам перевіряти або налаштовувати поведінку без взаємодії з прошивкою. Ця здатність до природного мовного розумування дозволяє новому поколінню талантів безшовно входити в сферу робототехніки, роблячи ключовий крок до відкритої платформи, що може спалахнути революцію в Ботах, як рух з відкритим кодом прискорює розвиток ШІ.

Щільність кадрів визначає траєкторію галузі. Структурована система універсальної освіти є надзвичайно важливою для постачання кадрів у сфері Ботів. Деякі компанії вже почали впроваджувати універсальні освітні курси на основі гуманоїдних роботів у державних школах K-12 у США. Цей курс розроблений з урахуванням незалежності платформи, може адаптуватися до різних форм роботів і надає студентам можливість практичної роботи. Цей позитивний сигнал зміцнює думку в галузі: протягом наступних кількох років рівень забезпечення ресурсами освіти в сфері Ботів буде на рівні з галуззю AI.

5. Перспективи на майбутнє

Візуально-мовно-дійова модель ) VLA (, інновації та ефекти масштабування якої, вже стали причинами появи економічних, ефективних та універсальних гуманоїдних Ботів. З розширенням складів Ботів на споживчий ринок, безпека, моделі фінансування та системи оцінки стали ключовими напрямками досліджень. Експерти в галузі впевнені, що шифрування технологій призведе до трьох

AGI4.11%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 4
  • Репост
  • Поділіться
Прокоментувати
0/400
WalletDetectivevip
· 13год тому
Відчуваю себе розгубленим, що знову сталося?
Переглянути оригіналвідповісти на0
ChainSpyvip
· 15год тому
Цей ai ще не почав серйозно працювати, щодня хвалиться.
Переглянути оригіналвідповісти на0
StablecoinArbitrageurvip
· 15год тому
*с sigh* ще один технічний гіперциклі... спочатку покажіть мені прибутковість на робототехнічному арбітражі, чесно кажучи.
Переглянути оригіналвідповісти на0
DaoDevelopervip
· 15год тому
вражаюче, як zk-proofs можуть забезпечити взаємодію між роботами та людьми, чесно кажучи
Переглянути оригіналвідповісти на0
  • Закріпити