Các cải tiến VLA và tính kinh tế theo quy mô đã xúc tác việc tạo ra các robot hình người giá cả phải chăng, hiệu quả và tổng quát.
An toàn, tài chính và đánh giá Robotics là những lĩnh vực đáng khám phá khi các nhà kho mở rộng sang lĩnh vực robot tiêu dùng.
Crypto sẽ cải thiện Robotics bằng cách cung cấp các đảm bảo kinh tế cho sự an toàn của robot và tối ưu hóa cơ sở hạ tầng docking, độ trễ và các pipeline thu thập dữ liệu của nó.
ChatGPT đã viết lại những kỳ vọng của nhân loại về AI. Với meta của LLM tương tác với thế giới phần mềm bên ngoài, rất nhiều người nghĩ rằng AI Agents là mục tiêu cuối cùng. Nhưng khi bạn nhìn vào những bộ phim khoa học viễn tưởng mang tính biểu tượng như Star Wars, Blade Runner hoặc Robocop, rõ ràng là nhân loại mơ về ngày mà AI có thể tương tác vật lý với thế giới – dưới hình thức Robotics.
Tại Pantera Capital, chúng tôi tin rằng khoảnh khắc ChatGPT cho Robotics đang đến gần. Đầu tiên, chúng ta sẽ xem xét mức độ giá cả phải chăng và những tiến bộ trong AI đã thay đổi không gian này như thế nào trong vài năm qua. Sau đó, chúng ta sẽ thảo luận về cách tối ưu hóa pin, độ trễ và thu thập dữ liệu sẽ thay đổi không gian này trong những năm tới và vai trò của crypto trong đó. Chúng ta sẽ kết thúc bằng cách giải thích lý do tại sao chúng tôi tin rằng an toàn, tài chính, đánh giá và giáo dục Robotics là những lĩnh vực đáng xem xét.
Sự phát triển trong không gian LLM đa phương thức đang cung cấp cho robot bộ não cần thiết để thực hiện các tác vụ phức tạp. Robot chủ yếu nhận thức môi trường của nó thông qua hai giác quan – thị giác và thính giác.
Theo truyền thống, các mô hình thị giác như mạng nơ-ron tích chập được thiết kế riêng cho các tác vụ phát hiện hoặc phân loại đối tượng, nhưng chúng thiếu sự hiểu biết để chuyển đổi những tầm nhìn đó thành các hành động có mục đích. LLM rất giỏi trong việc hiểu hoặc tạo văn bản, nhưng chúng bị hạn chế trong nhận thức về thế giới vật chất.
Nguồn: https://arxiv.org/html/2505.04769v1
Sử dụng các mô hình Vision-Language-Action (VLA), robot có thể thống nhất nhận thức thị giác, hiểu ngôn ngữ và hành động vật lý trong một khuôn khổ tính toán duy nhất. Vào tháng 2 năm 2025, Figure AI đã phát hành Helix, một mô hình VLA để điều khiển hình người tổng quát. Helix đặt ra các tiêu chuẩn mới trong không gian VLA và Robotics bằng cách cho phép khái quát hóa zero-shot, kiến trúc system1/system 2. Với khái quát hóa zero-shot, không cần đào tạo lại mở rộng cho mỗi tác vụ mà robot thực hiện. Helix có thể khái quát hóa ngay lập tức cho các tình huống, đối tượng và hướng dẫn mới. Theo kiến trúc system 1/ system 2, các lý luận cấp cao và đơn giản được tách biệt, cho phép tạo ra những robot hình người khả thi về mặt thương mại, kết hợp lý luận giống con người với độ chính xác theo thời gian thực.
Các công nghệ thay đổi thế giới đều có một điểm chung – chúng có thể tiếp cận được. Điện thoại thông minh, máy tính cá nhân, in 3D đều có thể tiếp cận được nhờ giá cả phải chăng đối với tầng lớp trung lưu. Khi robot như Unitree G1 rẻ hơn một chiếc Honda Accord hoặc mức lương tối thiểu là 34K USD ở Hoa Kỳ, không khó để tưởng tượng một thế giới nơi các nhiệm vụ vật lý và trần tục chủ yếu được thực hiện bởi robot.
Nguồn: https://www.unitree.com/g1/
Robotics đang mở rộng từ các giải pháp kho hàng sang người tiêu dùng. Thế giới được tạo ra cho con người. Con người có thể làm mọi thứ mà robot chuyên dụng có thể; robot chuyên dụng không thể làm mọi thứ mà con người có thể.Thay vì tạo ra các robot chuyên dụng cho các nhà máy, các công ty Robotics đang tạo ra nhiều robot hình người tổng quát hơn. Do đó, biên giới của Robotics không chỉ có thể được quan sát thấy trong các nhà kho mà còn trong cuộc sống hàng ngày của chúng ta.
Giá cả phải chăng là một trong những nút thắt chính để mở rộng. Số liệu mà tôi xem xét nhiều nhất là chi phí trên giờ. Chúng tôi định nghĩa chi phí là chi phí cơ hội của thời gian được sử dụng để đào tạo và sạc, chi phí thực hiện nhiệm vụ và chi phí của robot chia cho số giờ hoạt động của nó. Mức lương trung bình của ngành là chuẩn để giảm xuống.
Nguồn: https://www.bls.gov/news.release/empsit.t19.htm
Để thâm nhập hoàn toàn vào lĩnh vực kho hàng, chi phí trên giờ phải thấp hơn 31,39 USD. Lĩnh vực tiêu dùng lớn nhất ở trên là Giáo dục tư nhân & Dịch vụ Y tế. Robot phải có giá dưới 35,18 USD mỗi giờ để thâm nhập vào các lĩnh vực tiêu dùng.
Robot đang trở nên rẻ hơn, hiệu quả hơn và tổng quát hơn.
Pin luôn là một nút thắt cho robot thân thiện với người dùng. Các xe điện đời đầu như BMW i3 đã phải vật lộn để đạt được sự phổ biến do công nghệ pin yếu, hạn chế phạm vi hoạt động, tăng chi phí và giảm tính thực tế. Robot đang phải đối mặt với những thách thức tương tự. Robot Spot của Boston Dynamics chỉ có thể hoạt động trong 90 phút trước khi cần sạc lại; Unitree G1 có thời lượng pin khoảng 2 giờ. Không ai muốn tự sạc pin cho robot của họ sau mỗi 2 giờ. Do đó, cơ sở hạ tầng sạc và docking tự động là một lĩnh vực đáng xem xét. Hiện tại, có hai cách để robot được sạc lại – hoán đổi pin hoặc sạc pin.
Việc hoán đổi khay pin cho phép nhanh chóng hoán đổi pin đã cạn kiệt lấy pin đã sạc, giảm thiểu thời gian ngừng hoạt động và cho phép robot hoạt động liên tục trên hiện trường hoặc trên sàn nhà máy. Quá trình này có thể được thực hiện cả thủ công và tự động.
Sạc cảm ứng sạc robot không dây, mất nhiều thời gian hơn để sạc đầy robot nhưng quá trình này có thể dễ dàng được tự động hóa hoàn toàn.
Các hoạt động có độ trễ thấp có thể được chia thành hai loại: nhận thức và điều khiển từ xa. Nhận thức là cách robot nhận thức môi trường xung quanh. Điều khiển từ xa là khi một người điều khiển robot từ xa.
Theo Cintrini Research, nhận thức robotic bắt đầu với các cảm biến giá rẻ nhưng hào hình thành trong phần mềm hợp nhất, tính toán công suất thấp và các vòng điều khiển chặt chẽ theo mili giây. Khi robot biết ở đây và ở đó, một mạng nơ-ron nhẹ sẽ gắn thẻ các chướng ngại vật, pallet hoặc con người. Nhãn cảnh cung cấp cho trình lập kế hoạch, sau đó đưa ra các lệnh động cơ cho bàn chân, bánh xe hoặc cánh tay. Độ trễ nhận thức dưới 50ms tương đương với phản xạ của con người - bất cứ điều gì chậm hơn và robot của bạn sẽ thực sự vụng về. Do đó, 90% quyết định nằm trên bo mạch dưới dạng một mạng hành động ngôn ngữ thị giác duy nhất.
Đối với một robot hoàn toàn tự động, độ trễ của VLA hiệu suất cao phải thấp hơn 50ms; đối với robot điều khiển từ xa, độ trễ giữa người điều khiển và robot phải thấp hơn 50ms. Chúng ta có thể đánh giá đầy đủ tầm quan trọng của VLA ở đây, nếu đầu vào hình ảnh và văn bản được xử lý trong hai mô hình riêng biệt và được đưa vào một LLM lớn hơn để xử lý, độ trễ sẽ cao hơn nhiều so với 50ms.
Có ba cách để thu thập dữ liệu: dữ liệu video thế giới thực, dữ liệu tổng hợp, dữ liệu điều khiển từ xa. Các hạn chế chính đối với dữ liệu thế giới thực và dữ liệu tổng hợp là thu hẹp sự khác biệt giữa cách robot hoạt động trong môi trường vật lý so với cách chúng được mô hình hóa trong video hoặc mô phỏng. Dữ liệu video thế giới thực thiếu các chi tiết vật lý như phản hồi lực, sự không chính xác trong chuyển động khớp hoặc biến dạng vật liệu; Dữ liệu mô phỏng thiếu các biến không thể đoán trước như lỗi cảm biến và ma sát.
Phương pháp thu thập dữ liệu hứa hẹn nhất là điều khiển từ xa, trong đó người vận hành điều khiển robot từ xa để thực hiện các tác vụ. Vốn cho lao động của con người là hạn chế chính đối với dữ liệu điều khiển từ xa.
Phần cứng tùy chỉnh cũng đang được phát triển để cung cấp dữ liệu chất lượng cao. Mecka đang cung cấp dữ liệu chuyển động của con người chất lượng cao, khối lượng lớn với các chu kỳ lặp lại nhanh chóng để đào tạo AI Robotics. Nó thu thập một số dạng dữ liệu của con người bằng cả phương pháp chính thống và phần cứng tùy chỉnh, sau đó được xử lý và chuyển đổi để có thể sử dụng trong việc đào tạo mạng nơ-ron Robotics. Cùng với nhau, các pipeline này rút ngắn con đường từ dữ liệu đến Robotics có thể triển khai.
Crypto có thể được sử dụng để khuyến khích các bên không tin cậy trong việc cải thiện hiệu quả mạng cho Robotics. Nhìn vào các lĩnh vực chính ở trên, chúng tôi tin rằng crypto có thể nâng cao hiệu quả trong cơ sở hạ tầng docking, tối ưu hóa độ trễ và thu thập dữ liệu.
Các mạng cơ sở hạ tầng vật lý phi tập trung (DePIN) có tiềm năng đối với cơ sở hạ tầng docking. Khi robot hình người, giống như ô tô, di chuyển khắp thế giới, điều quan trọng là các trạm sạc phải dễ tiếp cận như các trạm xăng. Các mạng tập trung đòi hỏi đầu tư trả trước lớn, trong khi DePIN phân phối chi phí giữa các nhà khai thác node, cho phép cơ sở hạ tầng sạc mở rộng nhanh chóng và tiếp cận nhiều địa điểm hơn.
DePIN cũng được định vị để tận dụng cơ sở hạ tầng phi tập trung để tối ưu hóa độ trễ trong điều khiển từ xa. DePIN có thể tổng hợp tài nguyên máy tính từ các node biên phân tán về mặt địa lý, điều khiển từ xa từ. Điều này có nghĩa là các lệnh từ người điều khiển từ xa đến robot có thể được xử lý cục bộ hoặc bởi node có sẵn gần nhất, giảm thiểu khoảng cách dữ liệu phải di chuyển và có khả năng giảm độ trễ giao tiếp. Tuy nhiên, các dự án DePIN hiện tại chủ yếu tập trung vào lưu trữ phi tập trung, phân phối nội dung và chia sẻ băng thông. Một số dự án đã chứng minh lợi ích của điện toán biên cho các ứng dụng như phát trực tuyến hoặc IoT, nhưng không phải trong Robotics hoặc điều khiển từ xa.
Điều khiển từ xa là phương pháp thu thập dữ liệu hứa hẹn nhất. Tuy nhiên, rất tốn kém để một thực thể tập trung thuê nhân viên chuyên biệt để tạo ra dữ liệu điều khiển từ xa. DePIN giải quyết vấn đề này bằng cách khuyến khích các bên thứ ba cung cấp dữ liệu điều khiển từ xa. Reborn sử dụng token crypto để thưởng và điều phối một mạng lưới toàn cầu gồm những người điều khiển từ xa. Nó biến những đóng góp của họ thành tài sản kỹ thuật số được token hóa, cho phép một hệ thống phi tập trung, không cần cấp phép, nơi mọi người có thể kiếm tiền, quản lý và giúp đào tạo robot AGI.
Ai cũng biết rằng mục tiêu cuối cùng của Robotics là Robotics hoàn toàn tự động. Tuy nhiên, như đã thấy trong bộ phim bom tấn Termaintor, điều cuối cùng mà nhân loại muốn là khi quyền tự chủ của họ biến họ thành những robot hung hãn. An toàn AI đã là một mối quan tâm đối với LLM. Nhưng khi LLM có chân tay, an toàn Robotics là rất quan trọng để Robotics được chấp nhận trong xã hội.
An ninh kinh tế là một trong những trụ cột chính cho một nền kinh tế robot thịnh vượng.OpenMind, một công ty trong không gian này, đang xây dựng FABRIC—một lớp điều phối phi tập trung để máy móc thiết lập danh tính, xác minh sự hiện diện vật lý và tiếp cận vốn hoặc công việc thông qua các bằng chứng mật mã. Thay vì chỉ đơn giản là quản lý các marketplace tác vụ, FABRIC cho phép robot chứng minh chúng là ai, chúng ở đâu và chúng đã làm gì—mà không cần dựa vào các trung gian tập trung.
Các biện pháp bảo vệ hành vi và chứng thực danh tính được thực thi trên chuỗi, cho phép bất kỳ ai kiểm tra sự tuân thủ. Robot đáp ứng các tiêu chí về an toàn, chất lượng và vị trí sẽ được khen thưởng; những robot không đáp ứng sẽ bị cắt giảm hoặc loại, đảm bảo cả trách nhiệm giải trình và sự tin tưởng vào các mạng máy tự động.
Các mạng restaking của bên thứ ba như Symbiotic cũng có thể cung cấp các đảm bảo an ninh tương đương. Vẫn còn nhiều việc phải làm đối với các tham số slashing nhưng công nghệ này đã được đưa vào sản xuất. Chúng tôi tin rằng các hướng dẫn an toàn trên toàn ngành sẽ sớm được phát triển và các tham số slashing sẽ được mô hình hóa theo các hướng dẫn.
Một ví dụ về cách điều này có thể được thực hiện:
Một công ty Robotics tham gia Symbiotic với tư cách là một mạng lưới
Các tham số Slashing có thể xác minh như “Tiếp xúc vật lý với con người với lực vượt quá 2.500 newton” được thiết lập
Staker stake để cung cấp đảm bảo rằng robot sẽ không vi phạm các tham số slashing
Nếu robot vi phạm các tham số slashing, stake sẽ được sử dụng làm bồi thường cho nạn nhân
Theo mô hình này, các công ty Robotics được khuyến khích đặt an toàn Robotics làm ưu tiên số 1 của họ, trong khi bảo hiểm do các staker gộp lại sẽ tăng cường việc người tiêu dùng chấp nhận Robotics.
Đây là những gì nhóm Symbiotic nghĩ về Robotics:
Khuôn khổ staking phổ quát của Symbiotic được thiết kế để mở rộng khái niệm staking sang bất kỳ lĩnh vực hoặc giao thức nào có thể hưởng lợi từ an ninh kinh tế, cho dù thông qua các mô hình dùng chung hay riêng lẻ. Các ứng dụng từ bảo hiểm đến Robotics và cần được khái niệm hóa trên cơ sở từng trường hợp cụ thể. Ví dụ: các mạng Robotic có thể được xây dựng độc quyền với khuôn khổ staking phổ quát của Symbiotic, cho phép các bên liên quan cung cấp hỗ trợ kinh tế cho tính toàn vẹn của mạng.
OpenAI đã phổ biến AI, nhưng nền tảng cho khoảnh khắc ChatGPT đã được thực hiện từ nhiều năm trước. Các dịch vụ đám mây giúp các mô hình không bị giới hạn trong tính toán cục bộ, Huggingface giúp các mô hình có thể được mở nguồn, Kaggle cung cấp một không gian cho các kỹ sư AI thử nghiệm trong không gian này. Tất cả những bước nhỏ này đã giúp AI được phổ biến.
Không giống như AI, rất khó để bắt đầu với Robotics với số vốn hạn chế. Để Robotics được phổ biến, việc xây dựng robot phải dễ dàng như xây dựng các ứng dụng AI.
Chúng tôi tin rằng có chỗ để cải thiện ở ba lớp – tài chính, đánh giá và giáo dục.
Tài chính là một vấn đề đối với Robotics. Bạn chỉ cần một máy tính và tín dụng điện toán đám mây để xây dựng một máy tính. Để xây dựng một robot hoạt động đầy đủ, bạn cần mua phần cứng như động cơ, cảm biến và pin, chi phí có thể dễ dàng vượt quá 100K USD. Bản chất phần cứng của Robotics làm cho việc xây dựng Robotics kém linh hoạt và tốn kém hơn so với xây dựng trong AI.
Cơ sở hạ tầng để đánh giá Robotics thế giới thực còn non trẻ. Trong AI, các hàm mất mát được xác định rõ và các hoạt động thử nghiệm có thể được thực hiện hầu như. Tuy nhiên, một chính sách ảo tốt không chuyển trực tiếp thành một chính sách tốt trong thế giới thực.Cần có cơ sở hạ tầng để đánh giá các chính sách tự động trong các môi trường thế giới thực đa dạng để robot có thể cải thiện lặp đi lặp lại.
Khi các đường ray này được củng cố, tài năng sẽ tràn vào và robot hình người tự động sẽ tuân theo cùng một đường cong chấp nhận đã đưa Web 2 lên tầm cao. OpenMind, một công ty Robotics crypto, đã và đang thúc đẩy theo hướng đó. OM1, "Android cho robot" mã nguồn mở của công ty, biến phần cứng thô thành các agent có thể nâng cấp, nhận biết về mặt kinh tế. Các trình lập kế hoạch tầm nhìn, ngôn ngữ và chuyển động nhấp vào như các ứng dụng điện thoại và mọi bước lý luận đều xuất hiện bằng tiếng Anh đơn giản để người vận hành có thể kiểm tra hoặc chuyển hướng hành vi mà không cần chạm vào firmware. Khả năng lý luận bằng ngôn ngữ tự nhiên này trao quyền cho thế hệ tài năng tiếp theo chuyển sang Robotics một cách liền mạch, tạo nên một bước khởi đầu tuyệt vời cho loại nền tảng mở có thể khơi dậy sự bùng nổ Robotics theo cách mà mã nguồn mở đã thúc đẩy AI.
Nguồn: Một robot hình người được hỗ trợ bởi OM1 của OpenMind, hệ điều hành gốc AI, mã nguồn mở đầu tiên trên thế giới dành cho robot, đã nhấn nút để ăn mừng việc niêm yết ETF trên NASDAQ.
Mật độ tài năng xác định quỹ đạo của một ngành. Giáo dục có cấu trúc và dễ tiếp cận là rất quan trọng để tài năng được chuyển vào Robotics. Sự xuất hiện của OpenMind trên Nasdaq báo hiệu sự khởi đầu của một kỷ nguyên mới, nơi máy móc thông minh đóng vai trò trực tiếp trong cả đổi mới tài chính và giáo dục thế giới thực. OpenMind và Robostore đã công bố triển khai chương trình giảng dạy giáo dục được áp dụng rộng rãi đầu tiên cho robot hình người Unitree G1 trên khắp các trường công lập K–12 ở Hoa Kỳ. Chương trình giảng dạy được thiết kế để không phụ thuộc vào nền tảng và có thể thích ứng với các yếu tố hình thức robot khác nhau, mang đến cho sinh viên trải nghiệm thực tế với Robotics. Đây là một dấu hiệu đáng khích lệ và củng cố niềm tin của chúng tôi rằng số lượng tài liệu giáo dục cho Robotics sẽ ngang bằng với AI trong một vài năm tới.
Các cải tiến VLA và tính kinh tế theo quy mô đã xúc tác việc tạo ra các robot hình người giá cả phải chăng, hiệu quả và tổng quát. An toàn, tài chính và đánh giá Robotics là những lĩnh vực đáng khám phá khi các nhà kho mở rộng sang lĩnh vực robot tiêu dùng. Chúng tôi cũng có niềm tin mạnh mẽ rằng crypto sẽ cải thiện Robotics bằng cách cung cấp các đảm bảo kinh tế cho sự an toàn của robot và tối ưu hóa cơ sở hạ tầng docking, độ trễ và các pipeline thu thập dữ liệu của nó.
- Paul Veradittakit
Converge gọi tên Centrifuge là đối tác ra mắt đầu tiên của mình, bổ sung các sản phẩm RWA cấp tổ chức và các công cụ dành cho nhà phát triển vào marketplace được token hóa mới của mình.
Các công ty Mỹ đã chuyển 844 triệu đô la vào Bitcoin và Hyperliquid (HYPE), thúc đẩy sự tăng vọt về lãi suất mở và tâm lý tăng giá cho cả hai token.
Giám đốc FHFA William Pulte đã ra lệnh cho Fannie Mae (FNMA) và Freddie Mac (FMCC) xem xét cryptocurrency như một tài sản để đánh giá rủi ro cho vay thế chấp một gia đình.
Việc đảm bảo đăng ký ở Luxembourg cho phép Coinbase chuyển toàn bộ bộ dịch vụ crypto của mình trên tất cả 27 quốc gia EU theo chế độ MiCA mới.
Thượng viện Hoa Kỳ đã thông qua Đạo luật GENIUS với sự ủng hộ của lưỡng đảng. Dự luật quy định dự trữ đầy đủ và công bố được kiểm toán thường xuyên cho các nhà phát hành stablecoin lớn, cùng với các quyền chuộc lại rõ ràng và các tiêu chuẩn hoạt động.
Zama đang tiết lộ sản phẩm đầy tham vọng nhất của họ cho đến nay: Giao thức Blockchain Bảo mật Zama và công bố Vòng Series B trị giá 57 triệu đô la của họ với mức định giá hơn 1 tỷ đô la. Vòng này được dẫn dắt bởi Pantera Capital và Blockchange.
Sau thương vụ mua lại Bridge trị giá 1,1 tỷ đô la gần đây, Stripe hiện đang mua Privy và tích hợp 75 M ví tự quản lý của nó vào ngăn xếp thanh toán của Stripe trong khi vẫn giữ cho sản phẩm Privy độc lập.
Blockchain có thể kiểm chứng được tính toán ra mắt TestNet của mình trên khắp Hoa Kỳ, Việt Nam, Nigeria, Nga, Ấn Độ, Indonesia, Vương quốc Anh, Đặc khu Hành chính Hồng Kông và Trung Quốc Đại lục.
Cosmo Jiang và Eric Wallach giải thích các tiêu chuẩn công bố nhất quán cho các giao thức dựa trên token.
Dan Morehead của Pantera nói với "Open Interest" của Bloomberg rằng các nhà giao dịch tổ chức hiện coi Bitcoin như vàng, sử dụng các công cụ phái sinh và quyền giám sát mạnh mẽ để phòng ngừa các cú sốc địa chính trị. Các quy định thuận lợi mở ra hoạt động gây quỹ mới.
Pantera tin rằng giải pháp chứng minh con người của World sẽ trở thành cơ sở hạ tầng quan trọng trong một tương lai nơi con người và AI cùng tồn tại.
Xin chào, tôi là Paul Veradittakit, một Đối tác quản lý tại Pantera Capital, một trong những nhà đầu tư tổ chức lâu đời nhất và lớn nhất tập trung vào đầu tư vào các công ty blockchain và cryptocurrencies. Tôi đã ở trong ngành từ năm 2014 và công ty đầu tư vào vốn chủ sở hữu, các dự án token giai đoạn đầu và cryptocurrencies thanh khoản trên các sàn giao dịch. Tôi tập trung vào các khoản đầu tư giai đoạn đầu và chia sẻ suy nghĩ của mình về những gì đang diễn ra trong ngành trong bản tin hàng tuần này.
Nếu bạn có bất kỳ dự án nào cần tài trợ, vui lòng DM cho tôi trên twitter.