Las innovaciones en VLA y las economías de escala han catalizado la creación de robots humanoides asequibles, eficientes y generalizados.
Vale la pena explorar la seguridad, la financiación y la evaluación de la robótica a medida que los almacenes se expanden hacia la robótica de consumo.
Crypto mejorará la robótica al proporcionar garantías económicas para la seguridad de los robots y optimizar su infraestructura de acoplamiento, la latencia y los canales de recopilación de datos.
ChatGPT reescribió las expectativas de la humanidad para la IA. Con la meta de los LLM interactuando con el mundo del software externo, mucha gente pensó que los AI Agents son el objetivo final. Pero cuando se observan películas icónicas de ciencia ficción como Star Wars, Blade Runner o Robocop, queda claro que la humanidad sueña con el día en que la IA pueda interactuar físicamente con el mundo, en forma de robótica.
En Pantera Capital, creemos que el momento ChatGPT para la robótica está en el horizonte. Primero, examinaremos cómo la asequibilidad y los avances en la IA cambiaron el espacio en los últimos años. Luego, analizaremos cómo la optimización de la batería, la latencia y la recopilación de datos cambiarán el espacio en los próximos años y el papel que juega crypto en él. Terminaremos explicando por qué creemos que la seguridad, la financiación, la evaluación y la educación en robótica son verticales que vale la pena analizar.
Los desarrollos en el espacio de los LLM multimodal están dando a los robots el cerebro que necesitan para llevar a cabo tareas complejas. Los robots perciben principalmente su entorno a través de dos sentidos: el visual y el auditivo.
Tradicionalmente, los modelos visuales, como las redes neuronales convolucionales, se adaptaban a las tareas de detección o clasificación de objetos, pero carecen de la comprensión necesaria para convertir tales visiones en acciones útiles. Los LLM son excelentes para la comprensión o generación basada en texto, pero están restringidos en su percepción del mundo físico.
Fuente: https://arxiv.org/html/2505.04769v1
Utilizando modelos de Visión-Lenguaje-Acción (VLAs), los robots pueden unificar la percepción visual, la comprensión del lenguaje y la acción física en un único marco computacional. En febrero de 2025, Figure AI lanzó Helix, un modelo VLA para el control generalista de humanoides. Helix establece nuevos estándares en el espacio de VLA y robótica al permitir la generalización zero-shot, la arquitectura system1/system 2. Con la generalización zero-shot, no se necesita un reentrenamiento extenso para cada tarea que realiza el robot. Helix puede generalizar instantáneamente a nuevas situaciones, objetos e instrucciones. Bajo la arquitectura system 1/ system 2, los razonamientos de alto nivel y ligeros están separados, lo que permite humanoides comercialmente viables que combinan el razonamiento similar al humano con la precisión en tiempo real.
Todas las tecnologías que cambian el mundo tienen una cosa en común: son accesibles. Los smartphones, las computadoras personales y la impresión 3D se hacen accesibles al ser asequibles para la clase media. Cuando robots como el Unitree G1 son más baratos que un Honda Accord o el salario mínimo de 34K USD en los Estados Unidos, no es difícil imaginar un mundo donde las tareas físicas y mundanas sean realizadas principalmente por robots.
Fuente: https://www.unitree.com/g1/
La robótica se está expandiendo de las soluciones de almacén a los consumidores. El mundo está hecho para los humanos. Los humanos pueden hacer todo lo que pueden hacer los robots especializados; los robots especializados no pueden hacer todo lo que pueden hacer los humanos.En lugar de fabricar robots especializados para las fábricas, las empresas de robótica están fabricando robots humanoides más generalizados. Por lo tanto, la frontera de la robótica no solo se puede observar en los almacenes, sino también en nuestra vida cotidiana.
La asequibilidad es uno de los principales cuellos de botella para la expansión. La métrica que más miro es el costo por hora. Definimos el costo como el costo de oportunidad del tiempo utilizado para la capacitación y la carga, el costo de realizar la tarea y el costo del robot dividido por sus horas operativas. El salario promedio del sector es el punto de referencia para estar por debajo.
Fuente: https://www.bls.gov/news.release/empsit.t19.htm
Para penetrar completamente en el sector de los almacenes, el costo por hora debe ser inferior a 31,39 USD. El sector de consumo más grande arriba es el de Servicios Privados de Educación y Salud. Los robots deben costar menos de 35,18 USD por hora para penetrar en los verticales de consumo.
Los robots se están volviendo más baratos, más eficientes y más generalizados.
La batería siempre ha sido un cuello de botella para los robots fáciles de usar. Los primeros vehículos eléctricos, como el BMW i3, tuvieron problemas para ganar popularidad debido a la débil tecnología de la batería que limitaba el alcance, aumentaba el costo y reducía la practicidad. Los robots se enfrentan a los mismos desafíos. El robot Spot de Boston Dynamics solo puede funcionar durante 90 minutos antes de necesitar una recarga; Unitree G1 tiene una duración de batería de alrededor de 2 horas. Nadie quiere recargar manualmente las baterías de sus robots cada 2 horas. Por lo tanto, la recarga autónoma y la infraestructura de acoplamiento son un área que vale la pena analizar. Actualmente, hay dos formas en que se recargan los robots: intercambiando la batería o cargando la batería.
El intercambio de bandejas de baterías permite que las baterías agotadas se intercambien rápidamente por baterías cargadas, lo que minimiza el tiempo de inactividad y permite que los robots operen continuamente en el campo o en la fábrica. Este proceso se puede realizar tanto manual como automáticamente.
La carga inductiva carga los robots de forma inalámbrica, lleva más tiempo recargar completamente el robot, pero el proceso se puede automatizar fácilmente por completo.
Las operaciones de baja latencia se pueden dividir en dos categorías: percepción y teleoperaciones. La percepción es cómo el robot percibe su entorno. La teleoperación es cuando un humano controla el robot de forma remota.
Según Cintrini Research, la percepción robótica comienza con sensores baratos, pero el foso se forma en el software de fusión, la computación de baja potencia y los bucles de control ajustados a milisegundos. Una vez que el robot sabe aquí y allá, una red neuronal ligera etiqueta obstáculos, paletas o humanos. Las etiquetas de escena alimentan al planificador, que luego escupe comandos de motor a pies, ruedas o brazos. La latencia de percepción por debajo de 50 ms es equivalente a los reflejos de un humano; cualquier cosa más lenta y tu robot será realmente torpe. Por lo tanto, el 90% de las decisiones viven a bordo en forma de una sola red de visión-lenguaje-acción.
Para un robot totalmente autónomo, la latencia del VLA de alto rendimiento debe ser inferior a 50 ms; para un robot teleoperador, la latencia entre el operador y el robot debe ser inferior a 50 ms. Podemos apreciar plenamente la importancia de los VLAs aquí, si las entradas visuales y de texto se procesan en dos modelos por separado y se introducen en un LLM más grande para su procesamiento, la latencia sería mucho mayor que 50 ms.
Hay tres formas de recopilar datos: datos de video del mundo real, datos sintéticos, datos de teleoperación. Las principales limitaciones para los datos del mundo real y los datos sintéticos son cerrar la diferencia entre cómo se comportan los robots en entornos físicos frente a cómo se modelan en video o simulaciones. Los datos de video del mundo real carecen de detalles físicos como la retroalimentación de fuerza, las imprecisiones en el movimiento de las articulaciones o la deformación del material; los datos de simulación carecen de variables impredecibles como la falla del sensor y la fricción.
El método de recopilación de datos más prometedor es la teleoperación, donde los operadores humanos controlan los robots de forma remota para realizar tareas. El capital para la mano de obra humana es la principal limitación para los datos de teleoperación.
También se está desarrollando hardware personalizado para proporcionar datos de alta calidad. Mecka está proporcionando datos de movimiento humano de alta calidad y alto volumen con ciclos de iteración rápidos para el entrenamiento de robótica de IA. Captura varias formas de datos humanos con métodos convencionales y hardware personalizado que luego se procesan y transforman para que se puedan usar en el entrenamiento de redes neuronales de robótica. Juntos, estos canales acortan el camino desde los datos hasta la robótica implementable.
Crypto se puede utilizar para incentivar a terceros sin confianza a mejorar la eficiencia de la red para la robótica. Mirando las áreas clave anteriores, creemos que crypto puede mejorar la eficiencia en la infraestructura de acoplamiento, la optimización de la latencia y la recopilación de datos.
Las Redes de Infraestructura Física Descentralizada (DePIN) tienen el potencial de acoplar la infraestructura. Cuando los robots humanoides, como los automóviles, viajan por todo el mundo, es importante que las estaciones de carga sean tan accesibles como las estaciones de servicio. Las redes centralizadas requieren una gran inversión inicial, mientras que DePIN distribuye el costo entre los operadores de nodos, lo que permite que la infraestructura de carga se expanda rápidamente y llegue a más ubicaciones.
Los DePIN también están posicionados para aprovechar la infraestructura descentralizada para optimizar la latencia en las teleoperaciones. Los DePIN pueden agregar recursos informáticos de nodos perimetrales dispersos geográficamente, teleoperaciones desde. Esto significa que los comandos de un teleoperador al robot se pueden procesar localmente o por el nodo disponible más cercano, minimizando la distancia que deben viajar los datos y reduciendo potencialmente la latencia de la comunicación. Sin embargo, los proyectos DePIN actuales se centran principalmente en el almacenamiento descentralizado, la entrega de contenido y el intercambio de ancho de banda. Algunos proyectos han demostrado los beneficios de la computación perimetral para aplicaciones como la transmisión o el IoT, pero no en la robótica o las teleoperaciones.
La teleoperación es el método de recopilación de datos más prometedor. Sin embargo, es muy costoso para una entidad centralizada contratar personal especializado para producir datos de teleoperación. DePIN resuelve esto incentivando a terceros a proporcionar datos de teleoperación. Reborn utiliza tokens crypto para recompensar y coordinar una red global de teleoperadores. Convierte sus contribuciones en activos digitales tokenizados, lo que permite un sistema descentralizado y sin permisos donde cualquiera puede ganar, gobernar y ayudar a entrenar robots AGI.
Es de conocimiento común que el objetivo final de la robótica es la robótica totalmente autónoma. Sin embargo, como se ve en el éxito de taquilla Termaintor, lo último que quiere la humanidad es que su autonomía los convierta en robots agresivos. La seguridad de la IA ha sido una preocupación para los LLM. Pero cuando los LLM tienen extremidades, la seguridad de la robótica es crucial para que la robótica se adopte en la sociedad.
La seguridad económica es uno de los pilares clave para una economía robótica floreciente.OpenMind, una empresa en el espacio, está construyendo FABRIC: una capa de coordinación descentralizada para que las máquinas establezcan identidad, verifiquen la presencia física y accedan a capital o trabajos a través de pruebas criptográficas. En lugar de simplemente administrar los mercados de tareas, FABRIC permite a los robots demostrar quiénes son, dónde están y qué han hecho, sin depender de intermediarios centralizados.
Las protecciones de comportamiento y las certificaciones de identidad se aplican en la cadena, lo que permite a cualquiera auditar el cumplimiento. Los robots que cumplen con los criterios de seguridad, calidad y ubicación son recompensados; aquellos que fallan son castigados o descalificados, lo que garantiza tanto la responsabilidad como la confianza en las redes de máquinas autónomas.
Las redes de restaking de terceros, como Symbiotic, también pueden proporcionar garantías de seguridad iguales. Todavía hay trabajo por hacer en los parámetros de slashing, pero la tecnología ya está en producción. Creemos que pronto se desarrollarán pautas de seguridad para toda la industria y que los parámetros de slashing se modelarán según las pautas.
Un ejemplo de cómo se puede implementar esto:
Una empresa de robótica se une a Symbiotic como red
Se establecen parámetros de Slashing verificables, como "Hacer contacto físico con humanos a la fuerza que exceda los 2.500 newtons"
Los stakers hacen stake para proporcionar garantías de que el robot no violaría los parámetros de slashing
Si los robots violaran los parámetros de slashing, el stake se utilizaría como compensación para la víctima
Bajo este modelo, las empresas de robótica están incentivadas a poner la seguridad de la robótica como su prioridad número 1, mientras que el seguro agrupado por los stakers mejoraría la adopción de la robótica por parte del consumidor.
Esto es lo que el equipo de Symbiotic piensa sobre la robótica:
El marco de staking universal de Symbiotic fue diseñado para extender el concepto de staking a cualquier vertical o protocolo que pudiera beneficiarse de la seguridad económica, ya sea a través de modelos compartidos o individuales. Las aplicaciones van desde los seguros hasta la robótica y deben conceptualizarse caso por caso. Las redes robóticas, por ejemplo, podrían construirse exclusivamente con el marco de staking universal de Symbiotic, lo que permitiría a las partes interesadas proporcionar respaldo económico para la integridad de la red.
OpenAI popularizó la IA, pero el trabajo preliminar para el momento ChatGPT se realizó con años de anticipación. Los servicios en la nube hicieron posible que los modelos no se limitaran a la computación local, Huggingface hizo posible que los modelos fueran de código abierto, Kaggle proporcionó un espacio para que los ingenieros de IA experimentaran en el espacio. Todos estos pequeños pasos hicieron posible que la IA se popularizara.
A diferencia de la IA, es difícil comenzar en la robótica con capital limitado. Para que la robótica se popularice, construir robots debería ser tan fácil como construir aplicaciones de IA.
Creemos que hay margen de mejora en tres capas: financiación, evaluación y educación.
La financiación es un problema para la robótica. Solo necesita una computadora y créditos de computación en la nube para construir una computadora. Para construir un robot en pleno funcionamiento, necesita comprar hardware como motores, sensores y baterías, cuyo costo puede superar fácilmente los 100K USD. La naturaleza de hardware de la robótica hace que la construcción de robótica sea menos flexible y más costosa que la construcción en IA.
La infraestructura para la evaluación de la robótica del mundo real es incipiente. En la IA, las funciones de pérdida están bien definidas y las operaciones de prueba se pueden realizar virtualmente. Sin embargo, una buena política virtual no se traduce directamente en una buena política en el mundo real.Se necesita infraestructura para la evaluación de políticas autónomas en diversos entornos del mundo real para que los robots mejoren iterativamente.
Una vez que estos rieles se solidifiquen, el talento se inundará y los humanoides autónomos seguirán la misma curva de adopción que catapultó la Web 2. OpenMind, una empresa de robótica crypto, ya está impulsando en esa dirección. OM1, el "Android para robots" de código abierto de la compañía, convierte el hardware sin procesar en agentes actualizables y económicamente conscientes. Los planificadores de visión, lenguaje y movimiento encajan como aplicaciones de teléfono, y cada paso de razonamiento aparece en inglés sencillo para que los operadores puedan auditar o redirigir el comportamiento sin tocar el firmware. Esta capacidad de razonamiento en lenguaje natural permite a la próxima generación de talento moverse sin problemas a la robótica, lo que constituye un gran primer paso hacia el tipo de plataforma abierta que puede desencadenar el auge de la robótica de la misma manera que el código abierto aceleró la IA.
Fuente: Un robot humanoide impulsado por OM1 de OpenMind, el primer sistema operativo de código abierto nativo de IA para robots del mundo, presionó el botón para celebrar una cotización de ETF en el NASDAQ.
La densidad de talento define la trayectoria de una industria. La educación estructurada y accesible es crucial para que el talento se canalice hacia la robótica. La aparición de OpenMind en el Nasdaq señala el comienzo de una nueva era donde las máquinas inteligentes juegan un papel directo tanto en la innovación financiera como en la educación del mundo real. OpenMind y Robostore anunciaron el lanzamiento del primer plan de estudios educativo ampliamente adoptado para el robot humanoide Unitree G1 en las escuelas públicas K-12 de los Estados Unidos. El plan de estudios está diseñado para ser independiente de la plataforma y adaptable a varios factores de forma robótica, ofreciendo a los estudiantes experiencia práctica con la robótica. Esta es una señal alentadora y fortalece nuestra creencia de que la cantidad de material educativo para la robótica estará a la par con la de la IA en unos pocos años.
Las innovaciones en VLA y las economías de escala han catalizado la creación de robots humanoides asequibles, eficientes y generalizados. Vale la pena explorar la seguridad, la financiación y la evaluación de la robótica a medida que los almacenes se expanden hacia la robótica de consumo. También tenemos la firme convicción de que crypto mejorará la robótica al proporcionar garantías económicas para la seguridad de los robots y optimizar su infraestructura de acoplamiento, la latencia y los canales de recopilación de datos.
- Paul Veradittakit
Converge nombra a Centrifuge como su primer socio de lanzamiento, agregando productos RWA de grado institucional y herramientas de desarrollador a su nuevo mercado tokenizado.
Las empresas estadounidenses movieron 844 millones USD a Bitcoin e Hyperliquid (HYPE), lo que impulsó un aumento en el interés abierto y el sentimiento alcista para ambos tokens.
El director de la FHFA, William Pulte, ha ordenado a Fannie Mae (FNMA) y Freddie Mac (FMCC) que consideren la Cryptocurrency como un activo para las evaluaciones de riesgo de préstamos hipotecarios unifamiliares.
Asegurar el registro en Luxemburgo permite a Coinbase trasladar su conjunto completo de servicios crypto a los 27 estados de la UE bajo el nuevo régimen MiCA.
El Senado de los Estados Unidos aprobó la GENIUS Act con apoyo bipartidista. El proyecto de ley exige reservas completas y divulgaciones auditadas periódicas para los grandes emisores de stablecoin, junto con derechos de rescate claros y estándares operativos.
Zama está presentando su producto más ambicioso hasta la fecha: el protocolo de blockchain confidencial de Zama, y anunciando su Serie B de 57 millones USD con una valoración de más de 1 mil millones USD. La ronda fue liderada por Pantera Capital y Blockchange.
Después de la reciente adquisición de Bridge por 1,1 mil millones USD, Stripe ahora está comprando Privy e integrando sus 75 M de billeteras de autocustodia en la pila de pagos de Stripe, manteniendo el producto Privy independiente.
La blockchain de computación verificable lanza su TestNet en los Estados Unidos, Vietnam, Nigeria, Rusia, India, Indonesia, el Reino Unido, la RAE de Hong Kong y China continental.
Cosmo Jiang y Eric Wallach explican los estándares de divulgación consistentes para los protocolos basados en tokens.
Dan Morehead de Pantera le dice a "Open Interest" de Bloomberg que los operadores institucionales ahora tratan a Bitcoin como oro, utilizando derivados y una custodia sólida para cubrir los shocks geopolíticos. Las regulaciones favorables desbloquean nuevas recaudaciones de fondos.
Pantera cree que la solución de prueba de humanidad de World se convertirá en una infraestructura crítica en un futuro donde los humanos y la IA coexistan.
Hola, soy Paul Veradittakit, socio gerente de Pantera Capital, uno de los inversores institucionales más antiguos y grandes centrados en invertir en empresas de blockchain y cryptocurrencies. He estado en la industria desde 2014, y la firma invierte en acciones, proyectos de tokens en etapa inicial y cryptocurrencies líquidas en los exchanges. Me centro en las inversiones en etapa inicial y comparto mis pensamientos sobre lo que está sucediendo en la industria en este boletín semanal.
Si tiene algún proyecto que necesite financiación, no dude en enviarme un DM en twitter.