Liệu AI Agent có thể trở thành phao cứu sinh cho Web3+AI?
Các dự án AI Agent phổ biến và trưởng thành trong khởi nghiệp Web2 chủ yếu là các dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án đào tạo mô hình và tập hợp nền tảng đã trở thành xu hướng chính do vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chỉ chiếm 8%, nhưng tỷ lệ vốn hóa thị trường của chúng trong lĩnh vực AI lại cao tới 23%, cho thấy sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự gia tăng mức độ công nhận của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có giá trị vượt quá 1 tỷ USD.
Đối với các dự án Web3, việc đưa công nghệ AI vào sản phẩm ứng dụng không phải lõi AI có thể trở thành lợi thế chiến lược. Cách kết hợp cho dự án AI Agent nên chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token, nhằm thúc đẩy tính phi tập trung và hiệu ứng mạng.
Xu hướng AI: Tình trạng dự án liên tiếp ra mắt và sự gia tăng định giá
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng, nó đã thu hút hơn một trăm triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt con số ấn tượng 20,3 triệu USD. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng cho ra mắt các phiên bản cải tiến như GPT-4, GP4-4o. Với sự phát triển nhanh chóng này, các ông lớn công nghệ truyền thống đã nhận ra tầm quan trọng của các mô hình AI tiên tiến như LLM và đồng loạt giới thiệu các mô hình và ứng dụng AI của riêng mình. Ví dụ, Google đã phát hành mô hình ngôn ngữ lớn PaLM2, Meta đã tung ra Llama3, trong khi các công ty Trung Quốc đã giới thiệu các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan. Rõ ràng, lĩnh vực AI đã trở thành một đấu trường không thể thiếu.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà chúng tôi còn phát hiện từ điều tra thống kê nghiên cứu AI mã nguồn mở rằng báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu dự án vào năm 2023, đặc biệt là sau khi GPT được phát hành, số lượng dự án đã tăng 59,3% so với năm trước, phản ánh sự đam mê của cộng đồng lập trình viên toàn cầu đối với nghiên cứu AI.
Sự đam mê đối với công nghệ AI đã phản ánh trực tiếp trên thị trường đầu tư, thị trường đầu tư AI đang cho thấy sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Trên toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu USD, gấp đôi so với quý 1. Tổng số vốn tài trợ cho các startup AI đã tăng vọt lên 24 tỷ USD, tăng hơn gấp đôi so với năm trước. Trong đó, xAI thuộc sở hữu của Musk đã huy động được 6 tỷ USD, với định giá 24 tỷ USD, trở thành công ty khởi nghiệp AI có định giá cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang tái tạo lại bản đồ lĩnh vực công nghệ với tốc độ chưa từng có. Từ cuộc cạnh tranh gay gắt giữa các gã khổng lồ công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, rồi đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án liên tục xuất hiện, số tiền đầu tư đạt mức cao kỷ lục, và định giá cũng theo đó tăng lên. Nhìn chung, thị trường AI đang ở trong một giai đoạn phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ tạo ra dựa trên tìm kiếm đã đạt được những bước tiến đáng kể trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn gặp phải thách thức trong việc chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, như độ không chắc chắn trong đầu ra của mô hình, rủi ro tạo ra thông tin không chính xác và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các bối cảnh ứng dụng yêu cầu độ tin cậy rất cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu, học hỏi và giải quyết các vấn đề trong thế giới thực. Vì vậy, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent, nó đang dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI liên tục định hình lại cấu trúc năng suất, trong khi công nghệ Web3 thì đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với các khái niệm cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự đoán sẽ phát sinh một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi tin rằng AI Agent với khả năng thực hiện nhiệm vụ tự động của nó, đã thể hiện tiềm năng lớn để thực hiện ứng dụng quy mô lớn.
Để làm điều này, chúng tôi bắt đầu nghiên cứu sâu về các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, đến các ứng dụng và thị trường dữ liệu cũng như mô hình, nhằm xác định và đánh giá những loại dự án và tình huống ứng dụng tiềm năng nhất, để hiểu sâu hơn về sự kết hợp sâu sắc giữa AI và Web3.
Khái niệm rõ ràng: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu về AI Agent, để giúp độc giả hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ đưa ra một ví dụ qua một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến đi. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Công nghệ tạo ra thông tin được tăng cường bằng tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong bộ phim Iron Man, có khả năng hiểu nhu cầu và còn chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện nay, định nghĩa phổ biến về AI Agent trong ngành là một hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện các hành động tương ứng, thông qua việc thu thập thông tin môi trường bằng cảm biến, xử lý thông tin và tác động đến môi trường thông qua các bộ điều khiển (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý tích hợp các khả năng LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần, mà còn có khả năng lập kế hoạch, phân tích nhiệm vụ và thực hiện chúng một cách thực sự.
Theo định nghĩa và đặc điểm này, chúng ta có thể thấy AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được ứng dụng trong nhiều tình huống khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái xe tự động cấp độ L5 của Tesla, đều có thể được coi là các ví dụ về AI Agent. Những hệ thống này có đặc điểm chung là đều có khả năng cảm nhận đầu vào từ người dùng bên ngoài và từ đó tạo ra ảnh hưởng tương ứng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta nên chỉ rõ rằng Transformer là kiến trúc công nghệ cấu thành các mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGP là AI Agent tiến hóa dựa trên mô hình GPT.
Phân loại tổng quan
Thị trường AI Agent hiện tại vẫn chưa hình thành tiêu chuẩn phân loại thống nhất, chúng tôi đã gán nhãn cho 204 dự án AI Agent trong thị trường Web2 + Web3 theo cách riêng biệt. Dựa trên các nhãn nổi bật tương ứng với mỗi dự án, chúng tôi đã chia thành phân loại cấp một và phân loại cấp hai. Trong đó, phân loại cấp một bao gồm ba loại: cơ sở hạ tầng, tạo nội dung, tương tác với người dùng, sau đó được chia nhỏ dựa trên các trường hợp sử dụng thực tế:
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng các nội dung cơ bản hơn trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B đã trưởng thành và ứng dụng cơ bản.
Công cụ phát triển: Cung cấp cho các nhà phát triển công cụ và khung hỗ trợ xây dựng AI Agent.
Loại xử lý dữ liệu: Xử lý và phân tích dữ liệu ở các định dạng khác nhau, chủ yếu được sử dụng để hỗ trợ quyết định, cung cấp nguồn cho việc đào tạo.
Lớp huấn luyện mô hình: Cung cấp dịch vụ huấn luyện mô hình cho AI, bao gồm suy diễn, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: Chủ yếu hướng tới người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, ngành dọc và tự động hóa.
Nền tảng tổng hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, sự khác biệt ở chỗ có sự tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), thực hiện sự tương tác hai chiều với người dùng.
Loại hình đồng hành cảm xúc: Cung cấp sự hỗ trợ và đồng hành cảm xúc từ AI Agent.
Loại GPT: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Loại tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp thông tin chính xác hơn cho Agent.
Loại tạo nội dung: Các dự án này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để sinh ra các hình thức nội dung khác nhau dựa trên chỉ dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích hiện trạng phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, sự phát triển của AI Agent trong Internet truyền thống Web2 cho thấy xu hướng tập trung rõ rệt. Cụ thể, khoảng hai phần ba các dự án tập trung vào các loại hạ tầng, trong đó chủ yếu là các dịch vụ B2B và công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên nền tảng các công nghệ và khung đã được kiểm chứng qua thời gian, do đó giảm bớt độ khó và rủi ro trong phát triển. Tương tự như "xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Động lực từ nhu cầu thị trường: Một yếu tố quan trọng khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI trong thị trường doanh nghiệp cấp bách hơn, đặc biệt là trong việc tìm kiếm các giải pháp nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, thuận lợi cho việc họ phát triển các dự án tiếp theo.
Hạn chế về ứng dụng: Đồng thời, chúng tôi nhận thấy rằng các ứng dụng AI tạo nội dung trong thị trường B2B có ứng dụng tương đối hạn chế. Do sự không ổn định trong sản phẩm đầu ra, các doanh nghiệp có xu hướng ưu tiên những ứng dụng có thể tăng cường năng suất một cách ổn định. Điều này dẫn đến tỷ lệ của AI tạo nội dung trong kho dự án tương đối nhỏ.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và sự cân nhắc thực tế về các ứng dụng. Khi công nghệ AI tiếp tục phát triển và nhu cầu thị trường ngày càng rõ ràng, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án dẫn đầu AI Agent Web2
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, với ba dự án là Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của họ cho phép người dùng tạo, đào tạo và tương tác với các nhân vật ảo, những nhân vật có khả năng diễn ra đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Character.AI có 277 triệu lượt truy cập trong tháng 5, nền tảng này có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng có độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ. Character AI đã có hiệu suất xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu USD, với định giá đạt 1 tỷ USD, do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký một thỏa thuận cấp phép không độc quyền với công ty mẹ Google là Alphabet để sử dụng mô hình ngôn ngữ lớn của họ, cho thấy rằng Character AI đang sử dụng công nghệ tự phát triển. Đáng chú ý, các nhà sáng lập của công ty, Noam Shazeer và Daniel De Freitas, đã tham gia phát triển mô hình ngôn ngữ hội thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp câu trả lời chi tiết từ Internet. Việc trích dẫn và tham khảo liên kết đảm bảo tính đáng tin cậy và chính xác của thông tin, đồng thời nó sẽ giáo dục, hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu truy vấn đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lưu lượng truy cập ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng 2, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã thông báo nhận được 62,7 triệu USD tài trợ, định giá đạt 1,04 tỷ USD, do Daniel Gross dẫn đầu, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Các mô hình này phù hợp cho nghiên cứu học thuật chuyên nghiệp và các truy vấn trong lĩnh vực cụ thể, đảm bảo độ thật và độ tin cậy của thông tin.
Midjourney:
Giới thiệu sản phẩm: Người dùng có thể tạo ra các hình ảnh với nhiều phong cách và chủ đề khác nhau trong Midjourney thông qua Prompts, bao gồm từ hiện thực đến
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Cứu tinh AI Agent của Web3+AI: Phân loại dự án và phân tích triển vọng phát triển
Liệu AI Agent có thể trở thành phao cứu sinh cho Web3+AI?
Các dự án AI Agent phổ biến và trưởng thành trong khởi nghiệp Web2 chủ yếu là các dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án đào tạo mô hình và tập hợp nền tảng đã trở thành xu hướng chính do vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chỉ chiếm 8%, nhưng tỷ lệ vốn hóa thị trường của chúng trong lĩnh vực AI lại cao tới 23%, cho thấy sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự gia tăng mức độ công nhận của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có giá trị vượt quá 1 tỷ USD.
Đối với các dự án Web3, việc đưa công nghệ AI vào sản phẩm ứng dụng không phải lõi AI có thể trở thành lợi thế chiến lược. Cách kết hợp cho dự án AI Agent nên chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token, nhằm thúc đẩy tính phi tập trung và hiệu ứng mạng.
Xu hướng AI: Tình trạng dự án liên tiếp ra mắt và sự gia tăng định giá
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng, nó đã thu hút hơn một trăm triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt con số ấn tượng 20,3 triệu USD. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng cho ra mắt các phiên bản cải tiến như GPT-4, GP4-4o. Với sự phát triển nhanh chóng này, các ông lớn công nghệ truyền thống đã nhận ra tầm quan trọng của các mô hình AI tiên tiến như LLM và đồng loạt giới thiệu các mô hình và ứng dụng AI của riêng mình. Ví dụ, Google đã phát hành mô hình ngôn ngữ lớn PaLM2, Meta đã tung ra Llama3, trong khi các công ty Trung Quốc đã giới thiệu các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan. Rõ ràng, lĩnh vực AI đã trở thành một đấu trường không thể thiếu.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà chúng tôi còn phát hiện từ điều tra thống kê nghiên cứu AI mã nguồn mở rằng báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu dự án vào năm 2023, đặc biệt là sau khi GPT được phát hành, số lượng dự án đã tăng 59,3% so với năm trước, phản ánh sự đam mê của cộng đồng lập trình viên toàn cầu đối với nghiên cứu AI.
Sự đam mê đối với công nghệ AI đã phản ánh trực tiếp trên thị trường đầu tư, thị trường đầu tư AI đang cho thấy sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Trên toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu USD, gấp đôi so với quý 1. Tổng số vốn tài trợ cho các startup AI đã tăng vọt lên 24 tỷ USD, tăng hơn gấp đôi so với năm trước. Trong đó, xAI thuộc sở hữu của Musk đã huy động được 6 tỷ USD, với định giá 24 tỷ USD, trở thành công ty khởi nghiệp AI có định giá cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang tái tạo lại bản đồ lĩnh vực công nghệ với tốc độ chưa từng có. Từ cuộc cạnh tranh gay gắt giữa các gã khổng lồ công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, rồi đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án liên tục xuất hiện, số tiền đầu tư đạt mức cao kỷ lục, và định giá cũng theo đó tăng lên. Nhìn chung, thị trường AI đang ở trong một giai đoạn phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ tạo ra dựa trên tìm kiếm đã đạt được những bước tiến đáng kể trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn gặp phải thách thức trong việc chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, như độ không chắc chắn trong đầu ra của mô hình, rủi ro tạo ra thông tin không chính xác và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các bối cảnh ứng dụng yêu cầu độ tin cậy rất cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu, học hỏi và giải quyết các vấn đề trong thế giới thực. Vì vậy, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent, nó đang dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI liên tục định hình lại cấu trúc năng suất, trong khi công nghệ Web3 thì đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với các khái niệm cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự đoán sẽ phát sinh một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi tin rằng AI Agent với khả năng thực hiện nhiệm vụ tự động của nó, đã thể hiện tiềm năng lớn để thực hiện ứng dụng quy mô lớn.
Để làm điều này, chúng tôi bắt đầu nghiên cứu sâu về các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, đến các ứng dụng và thị trường dữ liệu cũng như mô hình, nhằm xác định và đánh giá những loại dự án và tình huống ứng dụng tiềm năng nhất, để hiểu sâu hơn về sự kết hợp sâu sắc giữa AI và Web3.
Khái niệm rõ ràng: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu về AI Agent, để giúp độc giả hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ đưa ra một ví dụ qua một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến đi. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Công nghệ tạo ra thông tin được tăng cường bằng tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong bộ phim Iron Man, có khả năng hiểu nhu cầu và còn chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện nay, định nghĩa phổ biến về AI Agent trong ngành là một hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện các hành động tương ứng, thông qua việc thu thập thông tin môi trường bằng cảm biến, xử lý thông tin và tác động đến môi trường thông qua các bộ điều khiển (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý tích hợp các khả năng LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần, mà còn có khả năng lập kế hoạch, phân tích nhiệm vụ và thực hiện chúng một cách thực sự.
Theo định nghĩa và đặc điểm này, chúng ta có thể thấy AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được ứng dụng trong nhiều tình huống khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái xe tự động cấp độ L5 của Tesla, đều có thể được coi là các ví dụ về AI Agent. Những hệ thống này có đặc điểm chung là đều có khả năng cảm nhận đầu vào từ người dùng bên ngoài và từ đó tạo ra ảnh hưởng tương ứng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta nên chỉ rõ rằng Transformer là kiến trúc công nghệ cấu thành các mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGP là AI Agent tiến hóa dựa trên mô hình GPT.
Phân loại tổng quan
Thị trường AI Agent hiện tại vẫn chưa hình thành tiêu chuẩn phân loại thống nhất, chúng tôi đã gán nhãn cho 204 dự án AI Agent trong thị trường Web2 + Web3 theo cách riêng biệt. Dựa trên các nhãn nổi bật tương ứng với mỗi dự án, chúng tôi đã chia thành phân loại cấp một và phân loại cấp hai. Trong đó, phân loại cấp một bao gồm ba loại: cơ sở hạ tầng, tạo nội dung, tương tác với người dùng, sau đó được chia nhỏ dựa trên các trường hợp sử dụng thực tế:
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng các nội dung cơ bản hơn trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B đã trưởng thành và ứng dụng cơ bản.
Công cụ phát triển: Cung cấp cho các nhà phát triển công cụ và khung hỗ trợ xây dựng AI Agent.
Loại xử lý dữ liệu: Xử lý và phân tích dữ liệu ở các định dạng khác nhau, chủ yếu được sử dụng để hỗ trợ quyết định, cung cấp nguồn cho việc đào tạo.
Lớp huấn luyện mô hình: Cung cấp dịch vụ huấn luyện mô hình cho AI, bao gồm suy diễn, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: Chủ yếu hướng tới người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, ngành dọc và tự động hóa.
Nền tảng tổng hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, sự khác biệt ở chỗ có sự tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), thực hiện sự tương tác hai chiều với người dùng.
Loại hình đồng hành cảm xúc: Cung cấp sự hỗ trợ và đồng hành cảm xúc từ AI Agent.
Loại GPT: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Loại tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp thông tin chính xác hơn cho Agent.
Loại tạo nội dung: Các dự án này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để sinh ra các hình thức nội dung khác nhau dựa trên chỉ dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích hiện trạng phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, sự phát triển của AI Agent trong Internet truyền thống Web2 cho thấy xu hướng tập trung rõ rệt. Cụ thể, khoảng hai phần ba các dự án tập trung vào các loại hạ tầng, trong đó chủ yếu là các dịch vụ B2B và công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên nền tảng các công nghệ và khung đã được kiểm chứng qua thời gian, do đó giảm bớt độ khó và rủi ro trong phát triển. Tương tự như "xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Động lực từ nhu cầu thị trường: Một yếu tố quan trọng khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI trong thị trường doanh nghiệp cấp bách hơn, đặc biệt là trong việc tìm kiếm các giải pháp nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, thuận lợi cho việc họ phát triển các dự án tiếp theo.
Hạn chế về ứng dụng: Đồng thời, chúng tôi nhận thấy rằng các ứng dụng AI tạo nội dung trong thị trường B2B có ứng dụng tương đối hạn chế. Do sự không ổn định trong sản phẩm đầu ra, các doanh nghiệp có xu hướng ưu tiên những ứng dụng có thể tăng cường năng suất một cách ổn định. Điều này dẫn đến tỷ lệ của AI tạo nội dung trong kho dự án tương đối nhỏ.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và sự cân nhắc thực tế về các ứng dụng. Khi công nghệ AI tiếp tục phát triển và nhu cầu thị trường ngày càng rõ ràng, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án dẫn đầu AI Agent Web2
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, với ba dự án là Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của họ cho phép người dùng tạo, đào tạo và tương tác với các nhân vật ảo, những nhân vật có khả năng diễn ra đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Character.AI có 277 triệu lượt truy cập trong tháng 5, nền tảng này có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng có độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ. Character AI đã có hiệu suất xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu USD, với định giá đạt 1 tỷ USD, do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký một thỏa thuận cấp phép không độc quyền với công ty mẹ Google là Alphabet để sử dụng mô hình ngôn ngữ lớn của họ, cho thấy rằng Character AI đang sử dụng công nghệ tự phát triển. Đáng chú ý, các nhà sáng lập của công ty, Noam Shazeer và Daniel De Freitas, đã tham gia phát triển mô hình ngôn ngữ hội thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp câu trả lời chi tiết từ Internet. Việc trích dẫn và tham khảo liên kết đảm bảo tính đáng tin cậy và chính xác của thông tin, đồng thời nó sẽ giáo dục, hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu truy vấn đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lưu lượng truy cập ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng 2, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã thông báo nhận được 62,7 triệu USD tài trợ, định giá đạt 1,04 tỷ USD, do Daniel Gross dẫn đầu, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Các mô hình này phù hợp cho nghiên cứu học thuật chuyên nghiệp và các truy vấn trong lĩnh vực cụ thể, đảm bảo độ thật và độ tin cậy của thông tin.
Midjourney:
Giới thiệu sản phẩm: Người dùng có thể tạo ra các hình ảnh với nhiều phong cách và chủ đề khác nhau trong Midjourney thông qua Prompts, bao gồm từ hiện thực đến