As inovações em VLA e as economias de escala catalisaram a criação de robôs humanoides acessíveis, eficientes e generalizados.
A segurança, o financiamento e a avaliação da robótica merecem ser explorados à medida que os armazéns se expandem para a robótica de consumo.
As Crypto melhorarão a robótica, fornecendo garantias económicas para a segurança dos robôs e otimizando a sua infraestrutura de acoplamento, latência e pipelines de recolha de dados.
O ChatGPT reescreveu as expectativas da humanidade para a IA. Com a meta de LLMs interagindo com o mundo do software externo, muitas pessoas pensaram que os AI Agents são o objetivo final. Mas quando se olha para filmes icónicos de ficção científica como Star Wars, Blade Runner ou Robocop, é claro que a humanidade sonha com o dia em que a IA possa interagir fisicamente com o mundo – sob a forma de robótica.
Na Pantera Capital, acreditamos que o momento ChatGPT para a robótica está no horizonte. Primeiro, examinaremos como a acessibilidade e os avanços na IA mudaram o espaço nos últimos anos. Em seguida, discutiremos como a otimização da bateria, da latência e da recolha de dados mudará o espaço nos próximos anos e o papel que a crypto desempenha nele. Terminaremos explicando por que acreditamos que a segurança, o financiamento, a avaliação e a educação em robótica são verticais que merecem ser observadas.
Os desenvolvimentos no espaço multi-modal LLM estão a dar aos robôs o cérebro de que precisam para realizar tarefas complexas. Os robôs percebem principalmente o seu ambiente através de dois sentidos – visual e auditivo.
Tradicionalmente, os modelos visuais, como as redes neurais convolucionais, eram adaptados para tarefas de deteção ou classificação de objetos, mas carecem da compreensão para converter tais visões em ações propositadas. Os LLMs são ótimos na compreensão ou geração baseada em texto, mas são restritos na sua perceção do mundo físico.
Fonte: https://arxiv.org/html/2505.04769v1
Usando modelos Vision-Language-Action (VLAs), os robôs podem unificar a perceção visual, a compreensão da linguagem e a ação física num único framework computacional. Em fevereiro de 2025, a Figure AI lançou o Helix, um modelo VLA para controlo generalista de humanoides. O Helix estabelece novos padrões no espaço VLA e da robótica, permitindo a generalização zero-shot, a arquitetura system1/system 2. Com a generalização zero-shot, não é necessário um extenso retreinamento para cada tarefa que o robô realiza. O Helix pode generalizar instantaneamente para novas situações, objetos e instruções. Sob a arquitetura system 1/ system 2, os raciocínios de alto nível e leves são separados, permitindo humanoides comercialmente viáveis que combinam raciocínio semelhante ao humano com precisão em tempo real.
As tecnologias que mudam o mundo têm todas uma coisa em comum – são acessíveis. Smartphones, computadores pessoais, impressão 3D são todos tornados acessíveis por serem acessíveis pela classe média. Quando robôs como o Unitree G1 são mais baratos do que um Honda Accord ou o salário mínimo de 34K USD nos Estados Unidos, não é difícil imaginar um mundo onde tarefas físicas e mundanas são maioritariamente feitas por robôs.
Fonte: https://www.unitree.com/g1/
A robótica está a expandir-se das soluções de armazém para os consumidores. O mundo é feito para os humanos. Os humanos podem fazer tudo o que os robôs especializados podem; os robôs especializados não podem fazer tudo o que os humanos podem.Em vez de fazer robôs especializados para fábricas, as empresas de robótica estão a fazer robôs humanoides mais generalizados. Assim, a fronteira da robótica não pode ser observada apenas em armazéns, mas nas nossas vidas quotidianas.
A acessibilidade é um dos principais estrangulamentos para a expansão. A métrica que mais observo é o custo por hora. Definimos o custo como o custo de oportunidade do tempo usado para treino e carregamento, o custo de fazer a tarefa e o custo do robô dividido pelas suas horas operacionais. O salário médio do setor é o benchmark a ser superado.
Fonte: https://www.bls.gov/news.release/empsit.t19.htm
Para penetrar totalmente no setor de armazéns, o custo por hora deve ser inferior a 31,39 USD. O maior setor de consumo acima é Educação Privada & Serviços de Saúde. Os robôs devem custar menos de 35,18 USD por hora para penetrar nas verticais de consumo.
Os robôs estão a tornar-se mais baratos, mais eficientes e mais generalizados.
A bateria sempre foi um estrangulamento para robôs fáceis de usar. Os primeiros veículos elétricos, como o BMW i3, tiveram dificuldades em ganhar popularidade devido à tecnologia de bateria fraca que limitava o alcance, aumentava o custo e reduzia a praticidade. Os robôs estão a enfrentar os mesmos desafios. O robô Spot da Boston Dynamics só pode operar por 90 minutos antes de precisar de uma recarga; o Unitree G1 tem uma duração de bateria de cerca de 2 horas. Ninguém quer recarregar manualmente as baterias dos seus robôs a cada 2 horas. Portanto, a recarga autónoma e a infraestrutura de acoplamento são uma área que vale a pena observar. Atualmente, existem duas maneiras de os robôs serem recarregados – trocar a bateria ou carregar a bateria.
A troca de bandejas de bateria permite que as baterias descarregadas sejam rapidamente trocadas por baterias carregadas, minimizando o tempo de inatividade e permitindo que os robôs operem continuamente no campo ou no chão de fábrica. Este processo pode ser feito tanto manual como automaticamente.
O carregamento indutivo carrega os robôs sem fios, leva mais tempo para recarregar totalmente o robô, mas o processo pode ser facilmente totalmente automatizado.
As operações de baixa latência podem ser divididas em duas categorias: perceção e teleoperações. A perceção é como o robô percebe o seu ambiente. A teleoperação é quando um humano está a controlar remotamente o robô.
De acordo com a Cintrini Research, a perceção robótica começa com sensores baratos, mas o fosso forma-se no software de fusão, computação de baixa potência e loops de controlo apertados em milissegundos. Uma vez que o robô sabe aqui e ali, uma rede neural leve etiqueta obstáculos, paletes ou humanos. Os rótulos de cena alimentam o planeador, que então cospe comandos de motor para pés, rodas ou braços. A latência de perceção inferior a 50ms é equivalente aos reflexos de um humano - qualquer coisa mais lenta e o seu robô vai ser realmente desajeitado. Assim, 90% das decisões vivem a bordo sob a forma de uma única rede de visão-linguagem-ação.
Para um robô totalmente autónomo, a latência do VLA de alto desempenho deve ser inferior a 50ms; para um robô teleoperador, a latência entre o operador e o robô deve ser inferior a 50ms. Podemos apreciar totalmente a importância dos VLAs aqui, se as entradas visuais e de texto forem processadas em dois modelos separadamente e alimentadas num LLM maior para processamento, a latência seria muito superior a 50ms.
Existem três maneiras de recolher dados: dados de vídeo do mundo real, dados sintéticos, dados de teleoperação. As principais restrições para dados do mundo real e dados sintéticos são colmatar a diferença entre como os robôs se comportam em ambientes físicos versus como são modelados em vídeo ou simulações. Os dados de vídeo do mundo real carecem de detalhes físicos, como feedback de força, imprecisões no movimento das articulações ou deformação do material; os dados de simulação carecem de variáveis imprevisíveis, como falha do sensor e fricção.
O método de recolha de dados mais promissor é a teleoperação, onde operadores humanos controlam robôs remotamente para realizar tarefas. O capital para o trabalho humano é a principal restrição para os dados de teleoperação.
O hardware personalizado também está a ser desenvolvido para fornecer dados de alta qualidade também. A Mecka está a fornecer dados de movimento humano de alta qualidade e alto volume com ciclos de iteração rápidos para treino de robótica de IA. Captura várias formas de dados humanos com métodos convencionais e hardware personalizado que é então processado e transformado para ser utilizável no treino de redes neurais de robótica. Juntos, estes pipelines encurtam o caminho dos dados para a robótica implantável.
A Crypto pode ser usada para incentivar partes sem confiança a melhorar as eficiências da rede para a robótica. Olhando para as principais áreas acima, acreditamos que a crypto pode melhorar as eficiências na infraestrutura de acoplamento, otimização da latência e recolha de dados.
As Decentralized Physical Infrastructure Networks (DePIN) têm o potencial de acoplar a infraestrutura. Quando os robôs humanoides, como os carros, viajam pelo mundo, é importante que as estações de carregamento sejam tão acessíveis quanto os postos de gasolina. As redes centralizadas exigem um grande investimento inicial, enquanto a DePIN distribui o custo entre os operadores de nós, permitindo que a infraestrutura de carregamento se expanda rapidamente e alcance mais locais.
As DePINs também estão posicionadas para alavancar a infraestrutura descentralizada para otimizar a latência nas teleoperações. As DePINs podem agregar recursos de computação de nós de ponta geograficamente dispersos, teleoperações de. Isto significa que os comandos de um teleoperador para o robô podem ser processados localmente ou pelo nó disponível mais próximo, minimizando a distância que os dados devem percorrer e potencialmente reduzindo a latência da comunicação. No entanto, os projetos DePIN atuais concentram-se principalmente no armazenamento descentralizado, na entrega de conteúdo e no compartilhamento de largura de banda. Alguns projetos demonstraram os benefícios da computação de ponta para aplicações como streaming ou IoT, mas não em robótica ou teleoperações.
A teleoperação é o método de recolha de dados mais promissor. No entanto, é muito caro para uma entidade centralizada contratar pessoal especializado para produzir dados de teleoperação. A DePIN resolve isto incentivando terceiros a fornecer dados de teleoperação. A Reborn usa tokens crypto para recompensar e coordenar uma rede global de teleoperadores. Transforma as suas contribuições em ativos digitais tokenizados, permitindo um sistema descentralizado e sem permissão onde qualquer pessoa pode ganhar, governar e ajudar a treinar robôs AGI.
É do conhecimento geral que o objetivo final da robótica é a robótica totalmente autónoma. No entanto, como visto no sucesso de bilheteira Termaintor, a última coisa que a humanidade quer é quando a sua autonomia os transforma em robôs agressivos. A segurança da IA tem sido uma preocupação para os LLMs. Mas quando os LLMs têm membros, a segurança da robótica é crucial para que a robótica seja adotada na sociedade.
A segurança económica é um dos pilares fundamentais para uma economia de robôs florescente.A OpenMind, uma empresa no espaço, está a construir a FABRIC—uma camada de coordenação descentralizada para que as máquinas estabeleçam identidade, verifiquem a presença física e acedam a capital ou empregos através de provas criptográficas. Em vez de simplesmente gerir marketplaces de tarefas, a FABRIC permite que os robôs provem quem são, onde estão e o que fizeram – sem depender de intermediários centralizados.
As proteções comportamentais e as atestações de identidade são aplicadas on-chain, permitindo que qualquer pessoa audite a conformidade. Os robôs que cumprem os critérios de segurança, qualidade e localização são recompensados; aqueles que falham são cortados ou desqualificados, garantindo tanto a responsabilização quanto a confiança nas redes de máquinas autónomas.
Redes de restaking de terceiros, como a Symbiotic, também podem fornecer garantias de segurança iguais. Ainda há trabalho a ser feito nos parâmetros de corte, mas a tecnologia já está em produção. Acreditamos que as diretrizes de segurança em toda a indústria serão desenvolvidas em breve e os parâmetros de corte seriam modelados de acordo com as diretrizes.
Um exemplo de como isto pode ser implementado:
Uma empresa de robótica junta-se à Symbiotic como uma rede
Parâmetros de corte verificáveis, como "Fazer contacto físico com humanos na força superior a 2.500 newtons", são estabelecidos
Os stakers fazem stake para fornecer garantias de que o robô não violaria os parâmetros de corte
Se os robôs violassem os parâmetros de corte, o stake seria usado como compensação para a vítima
Sob este modelo, as empresas de robótica são incentivadas a colocar a segurança da robótica como a sua prioridade número 1, enquanto o seguro reunido pelos stakers aumentaria a adoção da robótica pelo consumidor.
Aqui está o que a equipa da Symbiotic pensa sobre robótica:
O framework de staking universal da Symbiotic foi projetado para estender o conceito de staking a qualquer vertical ou protocolo que pudesse se beneficiar da segurança económica, seja através de modelos compartilhados ou individuais. As aplicações variam de seguros a robótica e precisam ser conceptualizadas caso a caso. As redes robóticas, por exemplo, poderiam ser construídas exclusivamente com o framework de staking universal da Symbiotic, permitindo que as partes interessadas forneçam apoio económico para a integridade da rede.
A OpenAI popularizou a IA, mas o trabalho de base para o momento ChatGPT foi feito anos antes. Os serviços de cloud tornaram possível que os modelos não fossem limitados à computação local, a Huggingface tornou possível que os modelos fossem de código aberto, a Kaggle forneceu um espaço para os engenheiros de IA experimentarem no espaço. Todos estes pequenos passos tornaram possível a popularização da IA.
Ao contrário da IA, é difícil começar na robótica com capital limitado. Para que a robótica seja popularizada, construir robôs deve ser tão fácil quanto construir aplicações de IA.
Acreditamos que há espaço para melhorias em três camadas – financiamento, avaliação e educação.
O financiamento é um problema para a robótica. Só precisa de um computador e créditos de computação em cloud para construir um computador. Para construir um robô totalmente funcional, precisa de comprar hardware, como motores, sensores e baterias, cujo custo pode facilmente ultrapassar os 100K USD. A natureza de hardware da robótica torna a construção de robótica menos flexível e mais cara do que a construção em IA.
A infraestrutura para a avaliação da robótica do mundo real é nascente. Na IA, as funções de perda são bem definidas e as operações de teste podem ser feitas virtualmente. No entanto, uma boa política virtual não se traduz diretamente numa boa política no mundo real.A infraestrutura para a avaliação de políticas autónomas em diversos ambientes do mundo real é necessária para que os robôs melhorem iterativamente.
Uma vez que estes trilhos se solidifiquem, o talento inundará e os humanoides autónomos seguirão a mesma curva de adoção que catapultou a Web 2. A OpenMind, uma empresa de robótica crypto, já está a avançar nessa direção. O OM1, o "Android para robôs" de código aberto da empresa, transforma hardware bruto em agentes atualizáveis e economicamente conscientes. Os planeadores de visão, linguagem e movimento encaixam-se como aplicações de telemóvel, e cada passo de raciocínio aparece em inglês simples para que os operadores possam auditar ou redirecionar o comportamento sem tocar no firmware. Esta capacidade de raciocínio em linguagem natural capacita a próxima geração de talentos a mudar-se perfeitamente para a robótica, tornando-se um ótimo primeiro passo para o tipo de plataforma aberta que pode desencadear o boom da robótica da mesma forma que o código aberto acelerou a IA.
Fonte: Um robô humanoide alimentado pelo OM1 da OpenMind, o primeiro sistema operativo de código aberto e nativo de IA do mundo para robôs, pressionou o botão para celebrar uma listagem de ETF na NASDAQ.
A densidade de talentos define a trajetória de uma indústria. A educação estruturada e acessível é crucial para que o talento seja canalizado para a robótica. A aparência da OpenMind na Nasdaq sinaliza o início de uma nova era onde as máquinas inteligentes desempenham um papel direto tanto na inovação financeira quanto na educação do mundo real. A OpenMind e a Robostore anunciaram o lançamento do primeiro currículo educacional amplamente adotado para o robô humanoide Unitree G1 em escolas públicas K–12 nos Estados Unidos. O currículo foi projetado para ser agnóstico de plataforma e adaptável a vários fatores de forma robótica, oferecendo aos alunos experiência prática com robótica. Este é um sinal encorajador e fortalece a nossa crença de que a quantidade de material educacional para robótica estará a par com a da IA em poucos anos.
As inovações em VLA e as economias de escala catalisaram a criação de robôs humanoides acessíveis, eficientes e generalizados. A segurança, o financiamento e a avaliação da robótica merecem ser explorados à medida que os armazéns se expandem para a robótica de consumo. Também temos uma forte convicção de que a crypto melhorará a robótica, fornecendo garantias económicas para a segurança dos robôs e otimizando a sua infraestrutura de acoplamento, latência e pipelines de recolha de dados.
- Paul Veradittakit
A Converge nomeia a Centrifuge como sua primeira parceira de lançamento, adicionando produtos RWA de nível institucional e ferramentas de desenvolvedor ao seu novo marketplace tokenizado.
Empresas americanas transferiram $844 milhões para Bitcoin e Hyperliquid (HYPE), impulsionando um salto no interesse aberto e no sentimento de alta para ambos os tokens.
O diretor da FHFA, William Pulte, ordenou que a Fannie Mae (FNMA) e a Freddie Mac (FMCC) considerem a cryptocurrency como um ativo para avaliações de risco de empréstimos hipotecários unifamiliares.
Garantir o registo no Luxemburgo permite que a Coinbase passeie o seu conjunto completo de serviços crypto por todos os 27 estados da UE sob o novo regime MiCA.
O Senado dos EUA aprovou a Lei GENIUS com apoio bipartidário. O projeto de lei exige reservas totais e divulgações regulares e auditadas para grandes emissores de stablecoin, juntamente com direitos de resgate e padrões operacionais claros.
A Zama está a revelar o seu produto mais ambicioso até à data: o Protocolo Blockchain Confidencial Zama, e a anunciar a sua Série B de $57 milhões com uma avaliação de mais de $1b. A rodada foi liderada pela Pantera Capital e Blockchange.
Após a recente aquisição de $1.1b da Bridge, a Stripe está agora a comprar a Privy e a integrar as suas 75 M carteiras de autocustódia na pilha de pagamentos da Stripe, mantendo o produto Privy independente.
A blockchain de computação verificável lança a sua TestNet nos Estados Unidos, Vietname, Nigéria, Rússia, Índia, Indonésia, Reino Unido, Hong Kong SAR e China Continental.
Cosmo Jiang e Eric Wallach explicam os padrões de divulgação consistentes para protocolos baseados em token.
Dan Morehead da Pantera diz ao "Open Interest" da Bloomberg que os traders institucionais agora tratam o Bitcoin como ouro, usando derivados e custódia robusta para proteger contra choques geopolíticos. Regulamentos favoráveis desbloqueiam novas angariações de fundos.
A Pantera acredita que a solução de prova de humano da World se tornará uma infraestrutura crítica num futuro onde humanos e IA coexistam.
Olá, sou o Paul Veradittakit, um Sócio-Gerente da Pantera Capital, um dos investidores institucionais mais antigos e maiores focados em investir em empresas blockchain e cryptocurrencies. Estou na indústria desde 2014, e a empresa investe em ações, projetos de token em estágio inicial e cryptocurrencies líquidas em exchanges. Eu foco em investimentos em estágio inicial e compartilho os meus pensamentos sobre o que está a acontecer na indústria nesta newsletter semanal.
Se tiver algum projeto que precise de financiamento, sinta-se à vontade para me enviar uma DM no twitter.