La IA y la encriptación lideran la transformación de la industria de los Bots. El modelo VLA abre una nueva era de automatización.

Logros significativos en la industria de los Bots: AI y encriptación lideran una nueva era de automatización

El rápido desarrollo de la inteligencia artificial está remodelando las expectativas de las personas sobre los Bots. A medida que los grandes modelos de lenguaje comienzan a interactuar con el mundo externo, muchas personas creen que los agentes de IA han alcanzado su apogeo. Sin embargo, si miramos hacia las obras clásicas de ciencia ficción, descubrimos que lo que la humanidad realmente anhela son los Bots que pueden interactuar en el mundo físico.

Los expertos de la industria creen que el campo de los Bots está a punto de experimentar un avance significativo similar al de ChatGPT. Este artículo primero analizará cómo la tecnología de IA ha cambiado el panorama de la industria en los últimos años, y luego explorará cómo los avances en tecnología, como las baterías, la latencia y la recopilación de datos, moldearán el futuro, así como el papel que tendrá la encriptación en ello. Por último, nos centraremos en áreas clave como la seguridad de los Bots, la financiación, la evaluación y la educación.

Bots de "ChatGPT Momentos": Revolución automatizada impulsada por AI y encriptación

1. Factores clave de la transformación

(1) el avance de la inteligencia artificial

El avance de los modelos de lenguaje multimodal proporciona el "cerebro" necesario para que los Bots realicen tareas complejas. Los Bots perciben el entorno principalmente a través de la visión y la audición.

Los modelos tradicionales de visión por computadora son buenos en la detección y clasificación de objetos, pero tienen dificultades para convertir la información visual en instrucciones de acción con un propósito. Los grandes modelos de lenguaje, aunque destacan en la comprensión y generación de texto, tienen una capacidad limitada para percibir el mundo físico.

A través del modelo de visual-lenguaje-acción ( VLA ), los Bots son capaces de integrar la percepción visual, la comprensión del lenguaje y la acción de entidades dentro de un marco computacional unificado. En febrero de 2025, una empresa de IA lanzó el modelo de control de Bots humanoides universal Helix, que estableció un nuevo estándar en la industria gracias a su capacidad de generalización de cero muestras y su arquitectura de doble sistema. La característica de generalización de cero muestras permite a los Bots adaptarse a nuevos escenarios, objetos e instrucciones sin necesidad de reentrenamiento para cada tarea. La arquitectura de doble sistema separa el razonamiento de alto nivel del razonamiento ligero, logrando Bots humanoides comerciales que combinan el pensamiento humano con precisión en tiempo real.

(2) Los Bots económicos se convierten en realidad

Las tecnologías que cambian el mundo tienen una característica común: la accesibilidad. Los teléfonos inteligentes, las computadoras personales y la tecnología de impresión 3D se han generalizado a precios asequibles para la clase media. Cuando el precio de ciertos Bots es inferior al de un automóvil de gama media o al ingreso anual mínimo en EE. UU., imaginar un mundo donde el trabajo físico y las tareas diarias son realizadas principalmente por Bots ya no parece inalcanzable.

(3) de almacenamiento a mercado de consumo

La tecnología de los Bots está expandiéndose de soluciones de almacenamiento al ámbito del consumo. Nuestro mundo está diseñado para los humanos: los humanos pueden realizar todo el trabajo de los Bots especializados, mientras que los Bots especializados no pueden realizar todo el trabajo de los humanos. Las empresas de Bots ya no se limitan a fabricar Bots para fábricas, sino que están desarrollando Bots humanoides más versátiles. Por lo tanto, la frontera de la tecnología de los Bots no solo existe en los almacenes, sino que también se infiltrará en la vida cotidiana.

El costo es uno de los principales cuellos de botella de la escalabilidad. El indicador más crítico es el costo integral por hora, que se calcula como la suma del costo de oportunidad del tiempo de entrenamiento y carga, el costo de ejecución de tareas y el costo de adquisición de Bots, dividido por el tiempo total de operación de los Bots. Este costo debe ser inferior al nivel salarial promedio de la industria relacionada para ser competitivo.

Para penetrar completamente en el campo del almacenamiento, el costo integral de los Robots debe ser inferior a 31.39 dólares por hora. Y en el mayor mercado de consumo, el sector de educación privada y servicios de salud, ese costo debe mantenerse por debajo de 35.18 dólares. Actualmente, los Robots están evolucionando hacia direcciones más económicas, eficientes y versátiles.

Bots "ChatGPT Moments": Revolución automatizada impulsada por IA y encriptación

2. El próximo avance en la tecnología de Bots

(1) optimización de batería

La tecnología de baterías siempre ha sido un cuello de botella para los robots amigables con el usuario. Los primeros vehículos eléctricos enfrentaron dificultades para popularizarse debido a las limitaciones de la tecnología de baterías, que resultaron en una corta autonomía, altos costos y baja practicidad, y los robots están enfrentando la misma dificultad. La autonomía de algunos robots conocidos es de solo 90 minutos a 2 horas. Los usuarios claramente no están dispuestos a cargar manualmente cada dos horas, por lo que la carga autónoma y la infraestructura de acoplamiento se han convertido en direcciones clave de desarrollo. Actualmente, hay dos modos principales de carga para robots: el cambio de batería o la carga directa.

El modo de reemplazo de batería permite la operación continua mediante el reemplazo rápido de un conjunto de baterías agotadas, minimizando el tiempo de inactividad y siendo adecuado para escenarios en el campo o en fábricas. Este proceso puede ser realizado manualmente o automatizado.

La carga por inducción utiliza un método de alimentación inalámbrico. Aunque el tiempo de carga completa es largo, puede lograr fácilmente un proceso totalmente automatizado.

(2) optimización de retraso

Las operaciones de baja latencia se pueden dividir en dos categorías: percepción del entorno y control remoto. La percepción se refiere a la capacidad de los Bots para reconocer el espacio del entorno, mientras que el control remoto se refiere específicamente al control en tiempo real por parte de un operador humano.

La investigación muestra que los sistemas de percepción de Bots comienzan con sensores baratos, pero la ventaja tecnológica radica en el software de fusión, la computación de bajo consumo y los circuitos de control precisos en milisegundos. Una vez que el Bots completa la localización espacial, una red neuronal ligera etiquetará elementos como obstáculos, paletas o humanos. Una vez que se ingresan las etiquetas de escena al sistema de planificación, se generan instantáneamente las instrucciones del motor que se envían a los pies, grupos de ruedas o brazos mecánicos. Un retraso de percepción de menos de 50 milisegundos es equivalente a la velocidad de reflejo humano; cualquier retraso que supere este umbral resultará en movimientos torpes del Bots. Por lo tanto, el 90% de las decisiones deben completarse localmente a través de una única red de visión-lenguaje-acción.

Los robots autónomos deben asegurarse de que el modelo VLA de alto rendimiento tenga una latencia inferior a 50 milisegundos; los robots controlados a distancia requieren que la latencia de la señal entre el terminal de operación y el robot no supere los 50 milisegundos. La importancia del modelo VLA se destaca aquí: si la entrada visual y textual es procesada por diferentes modelos antes de ser introducida en un modelo de lenguaje grande, la latencia total superará con creces el umbral de 50 milisegundos.

(3) optimización de recolección de datos

La recolección de datos se realiza principalmente a través de tres vías: datos de video del mundo real, datos sintéticos y datos de control remoto. El principal obstáculo entre los datos reales y los datos sintéticos radica en cerrar la brecha entre el comportamiento físico de los Bots y los modelos de video/simulación. Los datos de video del mundo real carecen de detalles físicos como la retroalimentación de fuerza, errores de movimiento en las articulaciones y deformaciones de materiales; los datos de simulación, por otro lado, carecen de variables impredecibles como fallos de sensores y coeficientes de fricción.

La forma de recolección de datos más prometedora es el control remoto: un operador humano controla a los Bots para ejecutar tareas. Sin embargo, el costo laboral es el principal factor limitante de la recolección de datos mediante control remoto.

El desarrollo de hardware personalizado también está proporcionando nuevas soluciones para la recopilación de datos de alta calidad. Algunas empresas combinan métodos convencionales con hardware personalizado para recopilar datos de movimiento humano en múltiples dimensiones, que luego se procesan y se convierten en conjuntos de datos adecuados para el entrenamiento de redes neuronales de Bots, junto con ciclos de iteración rápidos que proporcionan grandes volúmenes de datos de alta calidad para el entrenamiento de Bots de IA. Estos canales tecnológicos han acortado conjuntamente el camino de conversión de los datos originales a los Bots desplegables.

Bots "ChatGPT momento": Revolución automatizada impulsada por IA y encriptación

3. Áreas clave de exploración

(1) encriptación técnica y Bots fusión

La encriptación puede incentivar a las partes no confiables a mejorar la eficiencia de la red de Bots. Basado en los campos clave mencionados anteriormente, la encriptación puede mejorar la eficiencia en tres áreas: integración de infraestructura, optimización de retrasos y recolección de datos.

La red de infraestructura física descentralizada ( DePIN ) tiene el potencial de revolucionar la infraestructura de carga. Cuando los Robots humanoides operen a nivel global como los automóviles, las estaciones de carga deberán ser tan accesibles como las gasolineras. Las redes centralizadas requieren una enorme inversión inicial, mientras que DePIN distribuye los costos entre los operadores de nodos, permitiendo que las instalaciones de carga se expandan rápidamente a más áreas.

DePIN también puede utilizar infraestructura distribuida para optimizar la latencia en el control remoto. Al agregar recursos de computación de nodos de borde geográficamente dispersos, las instrucciones de control remoto pueden ser procesadas por nodos locales o los más cercanos disponibles, minimizando la distancia de transmisión de datos y reduciendo significativamente la latencia de comunicación. Sin embargo, los proyectos actuales de DePIN se centran principalmente en el almacenamiento descentralizado, la distribución de contenido y el intercambio de ancho de banda. Aunque hay proyectos que muestran las ventajas de la computación en el borde en aplicaciones de transmisión de medios o IoT, aún no se ha extendido al ámbito de los Bots o el control remoto.

El control remoto es la forma de recopilación de datos más prometedora, pero el costo de emplear personal profesional para la recopilación de datos por entidades centralizadas es extremadamente alto. DePIN incentiva a terceros a proporcionar datos de control remoto a través de encriptación de tokens para resolver este problema. Algunos proyectos están construyendo una red global de operadores remotos, convirtiendo sus contribuciones en activos digitales tokenizados, formando un sistema descentralizado sin permisos: los participantes pueden obtener beneficios, participar en la gobernanza y ayudar en el entrenamiento de Bots AGI.

(2) La seguridad siempre es una preocupación central

El objetivo final de la tecnología de Bots es lograr una autonomía completa, pero lo que menos desea la humanidad es que la autonomía convierta a los Bots en armas ofensivas. Los problemas de seguridad de los modelos de lenguaje grande han suscitado preocupaciones, y cuando estos modelos poseen la capacidad de actuar físicamente, la seguridad de los Bots se convierte en un requisito clave para la aceptación social.

La seguridad económica es uno de los pilares de la prosperidad del ecosistema de Bots. Algunas empresas en este campo están construyendo una capa de coordinación de máquinas descentralizada, que realiza la autenticación de identidad de dispositivos, la verificación de presencia física y el acceso a recursos a través de encriptación. A diferencia de la simple gestión de mercados de tareas, estos sistemas permiten que los Bots demuestren de manera autónoma su información de identidad, ubicación geográfica y registros de comportamiento sin depender de intermediarios centralizados.

Las restricciones de comportamiento y la autenticación de identidad se ejecutan a través de mecanismos en la cadena, asegurando que cualquier persona pueda auditar la conformidad. Los Bots que cumplan con los estándares de seguridad, los requisitos de calidad y las normativas regionales recibirán recompensas, mientras que los infractores enfrentarán sanciones o la descalificación, estableciendo así un mecanismo de responsabilidad y confianza en la red de máquinas autónomas.

La red de rehipoteca de terceros también puede proporcionar garantías de seguridad equivalentes. Aunque el sistema de parámetros de penalización aún necesita ser perfeccionado, la tecnología relacionada ha entrado en una etapa práctica. Se espera que las normas de seguridad de la industria estén a punto de formarse, y en ese momento, los parámetros de penalización se modelarán de acuerdo con estas normas.

4. Rellenar los vacíos en la tecnología de Bots

A diferencia de la IA, el campo de los Bots es difícil de ingresar cuando los fondos son limitados. Para lograr la popularización de los Bots, el umbral de desarrollo debe reducirse a un nivel de conveniencia similar al desarrollo de aplicaciones de IA. Creemos que hay espacio para mejorar en tres áreas: mecanismos de financiamiento, sistemas de evaluación y ecosistemas educativos.

La financiación es un punto crítico en el campo de los Bots. Desarrollar un programa informático solo requiere una computadora y recursos de computación en la nube, mientras que construir un robot completamente funcional requiere la adquisición de motores, sensores, baterías y otros hardware, lo que puede superar fácilmente los 100,000 dólares. Esta propiedad del hardware hace que el desarrollo de robots sea menos flexible y más costoso en comparación con la IA.

La infraestructura de evaluación de robots en escenarios reales aún se encuentra en una etapa incipiente. En el campo de la IA, se ha establecido un sistema de funciones de pérdida claro, y las pruebas se pueden virtualizar por completo. Sin embargo, las excelentes estrategias virtuales no pueden convertirse directamente en soluciones efectivas en el mundo real. Los robots necesitan instalaciones de evaluación de estrategias autónomas para probar en una variedad de entornos reales para poder lograr una optimización iterativa.

Cuando esta infraestructura madure, el talento fluirá en grandes cantidades, y los Bots humanoides repetirán la curva de explosión de Web2. Algunas empresas están avanzando en esta dirección: sus proyectos de código abierto transforman el hardware original en agentes inteligentes escalables con conciencia económica. Los módulos de visión, lenguaje y planificación de movimiento pueden ser plug-and-play como aplicaciones móviles, y todos los pasos de inferencia se presentan en un inglés claro, permitiendo a los operadores auditar o ajustar el comportamiento sin necesidad de interactuar con el firmware. Esta capacidad de razonamiento en lenguaje natural permite que la nueva generación de talento ingrese sin problemas al campo de la robótica, dando un paso clave hacia una plataforma abierta que desencadene la revolución de los Bots, al igual que el movimiento de código abierto aceleró la IA.

La densidad de talento determina la trayectoria de la industria. Un sistema educativo inclusivo y estructurado es crucial para el suministro de talento en el campo de los Bots. Algunas empresas han comenzado a lanzar cursos de educación general basados en robots humanoides en las escuelas públicas K-12 de Estados Unidos. El diseño del curso es independiente de la plataforma, pudiendo adaptarse a diversas formas de robots, y brinda a los estudiantes oportunidades de práctica. Esta señal positiva refuerza el juicio en la industria: en los próximos años, la riqueza de recursos educativos sobre robots será comparable a la del campo de la inteligencia artificial.

5. Perspectivas futuras

El modelo de acción-visual-lenguaje ( VLA ), con sus innovaciones y efectos de economías de escala, ha dado lugar a robots humanoides asequibles, eficientes y versátiles. A medida que los robots de almacén se expanden hacia el mercado de consumo, la seguridad, los modelos de financiación y los sistemas de evaluación se convierten en direcciones clave de exploración. Los expertos de la industria están convencidos de que la encriptación jugará un papel fundamental en tres

AGI-0.48%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Republicar
  • Compartir
Comentar
0/400
WalletDetectivevip
· hace8h
Me siento perdido, ¿qué problema ha surgido de nuevo?
Ver originalesResponder0
ChainSpyvip
· hace10h
Este ai aún no ha trabajado en serio, todos los días se la pasa de alcista.
Ver originalesResponder0
StablecoinArbitrageurvip
· hace10h
*sigh* otro ciclo de exageración tecnológica... muéstrame primero los márgenes de beneficio en el arbitraje de robots, para ser honesto.
Ver originalesResponder0
DaoDevelopervip
· hace10h
fascinante cómo las pruebas zk podrían asegurar las interacciones entre robots y humanos, para ser honesto.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)