Những người làm việc trong lĩnh vực AI đều biết rằngđánh bài online, nếu bây giờ bạn không đang nghiên cứu về Agent, thì khi ra ngoài bạn sẽ không dám nhìn ai cả.
Nhưngkeo 88, rốt cuộc Agent là gì? Có lẽ ngay cả các chuyên gia cũng không chắc có thể giải thích rõ ràng. Điều này thực sự không ai phải chịu trách nhiệm, bởi ai mà ngờ được rằng ý nghĩa của khái niệm này lại rộng đến vậy cơ chứ?
Bài viết này tập trung vào việc thảo luận rõ ràng ba vấn đề:
Trong giới nghiên cứu AIđánh bài online, khi mọi người bàn luận về "Agent", họ thường gặp nhiều lúng túng. Một tình huống phổ biến xảy ra là bạn phải liên tục nhắc lại khái niệm "Agent" mà mình đang đề cập đến, cụ thể nó ám chỉ điều gì, để đảm bảo rằng cuộc thảo luận tiếp theo diễn ra một cách nghiêm túc và rõ ràng. Nguyên nhân gây ra tình trạng khó xử này là do thuật ngữ "Agent" mang ý nghĩa khác nhau tùy thuộc vào ngữ cảnh sử dụng. Có lúc nó ám chỉ một thực thể tự chủ trong môi trường, nhưng có lúc lại đề cập đến một mô hình máy học đơn giản hơn. Điều này khiến cho việc thống nhất khái niệm trở nên phức tạp hơn bao giờ hết.
Trong lĩnh vực trí tuệ nhân tạo (AI)keo 88, thuật ngữ "Agent" có nguồn gốc cực kỳ lâu đời, có thể đã xuất hiện trong các cuộc thảo luận học thuật từ thập niên 1950 của thế kỷ trước. Tính đến nay, một trong những nguồn trích dẫn học thuật được biết đến nhiều nhất về thuật ngữ này đến từ lý thuyết học tăng cường (reinforcement learning). Trong đó, Agent không chỉ là một khái niệm lý thuyết rõ ràng mà còn là một thực thể có khả năng tương tác với môi trường, có mục tiêu cụ thể, học hỏi từ kinh nghiệm và chủ động đưa ra hành động mới để khám phá những điều chưa biết. Điều này cũng chính là bài toán cân bằng giữa "khai thác" (exploitation) và "thăm dò" (exploration) mà chúng ta thường gặp trong học máy. Sự kết hợp giữa việc học từ kinh nghiệm và khả năng hành động chủ động chính là cốt lõi giúp Agent trở thành công cụ mạnh mẽ trong việc giải quyết các vấn đề phức tạ
Tuy nhiênkeo 88, trong bối cảnh ứng dụng AI tại các doanh nghiệp hiện nay cũng như trong vòng xoáy đầu tư về AI, khái niệm Agent mà mọi người đang thảo luận thực chất là một khái niệm mới hình thành cùng với sự xuất hiện của LLM (mô hình ngôn ngữ lớn). Thông thường, Agent được hiểu là hệ thống thông minh tự trị (autonomous) được xây dựng dựa trên công nghệ LLM. Nếu bạn suy nghĩ kỹ, thì Agent này không hoàn toàn giống với Agent trong học tăng cường (reinforcement learning). Ở đây, Agent nhấn mạnh khả năng thực hiện những nhiệm vụ phức tạp trong thế giới thực theo cách tự chủ; trong khi đó, Agent trong học tăng cường lại tập trung vào cách nó học từ việc tương tác với môi trường. Tuy nhiên, nhiều người kỳ vọng hệ thống Agent có khả năng "tự tiến hóa," điều này dường như đã vay mượn khái niệm từ Agent trong học tăng cường. Có lẽ cần phải phân biệt rõ ràng hơn giữa hai khái niệm này để tránh gây nhầm lẫn.
Điều phức tạp hơn là trong ngành công nghiệp AI hiện tạitai ban ca, thuật ngữ "Agent" vẫn đang được sử dụng với ít nhất hai cách hiểu khác nhau. Một nghĩa là khái niệm chung, còn một nghĩa khác mang tính đặc thù rõ ràng. Những sự khác biệt này không chỉ gây nhầm lẫn cho người mới tiếp cận lĩnh vực mà còn đặt ra thách thức khi thảo luận giữa các chuyên gia. Chính sự thiếu thống nhất này khiến việc định hình khái niệm Agent trở nên khó khăn và cần thêm nhiều nghiên cứu để làm rõ hơn.
Trước tình hình khái niệm về Agent đang trở nên hỗn loạntai ban ca, nhiều chuyên gia hàng đầu trong lĩnh vực AI đã bắt đầu xuất hiện để làm rõ những ý tưởng này. Đáng chú ý có bài viết trên blog của Anthropic [2], một bài viết khác từ người sáng lập LangChain [3], tài liệu chính thức của LlamaIndex [4], và một cuộc phỏng vấn với Andrew Ng [5]. Dựa trên những thông tin đó, ngành công nghiệp dường như đang dần đi đến sự đồng thuận chung về khái niệm Agent, cụ thể như sau:
Agentic System
Thay thế cho khái niệm đại lý (Agent) mơ hồ và chung chung trước đâykeo 88, thuật ngữ Hệ thống Đại lý (Agentic System) ngày càng được chú ý. Đặc biệt, định nghĩa của người sáng lập LangChain mang lại sự rõ ràng nhất, như sau [3]:In practicekeo 88, we see that most “agentic systems” are a combination of workflows and agents. This is why I actually hate talking about whether something is an agent, but prefer talking about how agentic a system is.
Dịch văn:
hệ thống agentic
Xây dựng các đại diện hiệu quả
Hình ảnh trên minh họa cho quy trì Khi gọi mô hìnhđánh bài online, các bước sẽ được thực hiện tuần tự. Toàn bộ quy trình workflow sẽ được chia thành nhiều bước khác nhau để hoàn thành, từ đó xác định rõ ràng từng bước cần làm trước, sau và cụ thể như thế nào. Bước đầu tiên sẽ xử lý cái gì, bước thứ hai sẽ tiếp tục ra sao, tất cả đều đã được lên kế hoạch chi tiết từ trước. Điều này giúp đảm bảo rằng mọi thao tác đều diễn ra trơn tru và hiệu quả trong suốt quá trình vận hành.
Hình ảnh này trình bày mô hình thiết kế có tên là Điểm khác biệt so với mô hình trước đó là ở chỗđánh bài online, Prompt Chaining thực hiện tuần tự, trong khi Parallelization cho thấy rằng một số cuộc gọi đến LLM (Language Model) sẽ được thực hiện đồng thời. Tuy nhiên, dù là chạy tuần tự hay đồng thời, thì đường dẫn thực thi vẫn đã được xác định trước.
Hình ảnh này mô tả một mô hình được gọi là Routingtai ban ca, trong đó có ba nút LLM Call, nhưng chỉ một trong số chúng sẽ được chọn để thực hiện. Điểm khác biệt rõ rệt so với hai mô hình trước đó là Prompt Chaining và Parallelization đã xác định sẵn các đường dẫn thực thi, còn đối với Routing, đường dẫn thực thi phải đợi dữ liệu đầu vào đến thì mới có thể chính thức xác định. Nếu so sánh với ngôn ngữ lập trình, Routing giống như một điều kiện if. Thêm vào đó, Routing mang lại sự linh hoạt hơn khi cần phân nhánh dựa trên dữ liệu đầu vào, điều này giúp tối ưu hóa hiệu suất bằng cách chỉ kích hoạt các nút phù hợp nhất cho từng trường hợp cụ thể. Điều này đặc biệt hữu ích trong các hệ thống lớn cần xử lý nhiều loại đầu vào đa dạng và phức tạp.
Hình ảnh này minh họa mô hình Autonomous Agent (mô hình này đã được giới thiệu ở phần đầu bài viết). Mức độ tự chủ trong mô hình này được nâng cao hơn nữa. Trong mô hình Routing trước đâyđánh bài online, dù con đường thực thi cụ thể được xác định một cách động dựa trên dữ liệu đầu vào, ít nhất ba tuyến đường thực thi khả dĩ vẫn được định sẵn từ trước. Tuy nhiên, trong mô hình Autonomous Agent, con đường thực thi cụ thể cũng không thể được xác định trước. Hệ thống thường sẽ thực hiện nhiều vòng lặp hoặc bước xử lý, và không ai có thể biết trước bước tiếp theo sẽ thực hiện hành động nào, cũng như tổng số bước cần thực hiện không thể được xác định trước. Hơn nữa, trong quá trình hoạt động, hệ thống này liên tục thích nghi với hoàn cảnh mới và đưa ra các quyết định tức thời dựa trên thông tin thu thập được trong từng bước. Điều này làm cho nó trở nên linh hoạt và phù hợp với những tình huống phức tạp mà ngay cả con người đôi khi cũng khó có thể dự đoán trước. Với khả năng tự điều chỉnh này, mô hình Autonomous Agent mang lại một tiềm năng lớn trong việc giải quyết các vấn đề không xác định hoặc thay đổi liên tục.
Các mô hình thiết kế Agent được đề cập ở trên không phải là tất cả các trường hợp có thể xảy ratai ban ca, nhưng chúng đã phần nào thể hiện bản chất của một Agent (hoặc nói chính xác hơn, một hệ thống thông minh tự trị). Một Agent như vậy không chỉ đơn thuần là một thực thể hoạt động độc lập mà còn là một hệ thống phức tạp với khả năng học hỏi, thích nghi và ra quyết định dựa trên dữ liệu môi trường. Nó giống như một sinh vật sống trong thế giới ảo, liên tục tương tác với các yếu tố xung quanh để tối ưu hóa hành vi và mục tiêu của mình. Điều này mở ra cánh cửa cho vô số ứng dụng trong trí tuệ nhân tạo, từ quản lý hệ thống mạng đến điều khiển robot hoặc thậm chí hỗ trợ con người trong các công việc hàng ngày.
Agentic System
) ba mức độ tự trị khác nhau. Mức độ tự trị khác nhautai ban ca, bản chất nằm ở chỗ,
Đường đi thực thi được sắp xếp hệ thống quyết định vào thời điểm nào
:
Tóm lạitai ban ca, từ việc kết nối gợi ý (Prompt Chaining) và song song hóa (Parallelization), cho đến định tuyến (Routing), rồi đến các đại diện tự hành (Autonomous Agent), mức độ tự chủ của hệ thống ngày càng tăng. Trong khi đó, khả năng kiểm soát chính xác của các kỹ sư con người đối với hệ thống dần giảm đi, dẫn đến hành vi của hệ thống trở nên linh hoạt hơn. Tất nhiên, theo quy luật chung, khả năng giải quyết vấn đề phức tạp mà hệ thống có thể xử lý cũng sẽ ngày càng gia tăng. Điều này mở ra nhiều cơ hội mới, nhưng đồng thời cũng đặt ra thách thức lớn trong việc đảm bảo tính ổn định và hiệu quả của hệ thống trong mọi tình huống thực tế.
Việc thiết kế một Agent không chỉ đơn giản là việc hiểu rõ về thuật toán của mô hình hay kỹ thuật lập trình mà thôi. Đây thực sự là một dự án hệ thống đòi hỏi khả năng trừu tượng hóa ở nhiều cấp độ khác nhau. Từ việc xác định mục tiêu và vai trò của Agent trong môi trườngtai ban ca, cho đến việc xây dựng cơ chế phản ứng linh hoạt với các tình huống phức tạp, tất cả đều yêu cầu một tầm nhìn chiến lược và tư duy logic chặt chẽ. Thiết kế một Agent không chỉ dừng lại ở việc tạo ra một công cụ thực thi nhiệm vụ mà còn là quá trình sáng tạo ra một "tâm trí" nhân tạo có thể tự thích nghi và học hỏi.
Ở tầng cao nhấtđánh bài online, việc tìm kiếm sự phù hợp với ngữ cảnh kinh doanh là điều cần thiết. Một mặt, bạn phải hiểu rõ quy trình kinh doanh để nhận ra đâu là những điểm quan trọng mang lại giá trị lớn cho công ty; mặt khác, bạn cũng cần nắm vững giới hạn của công nghệ AI dựa trên mô hình ngôn ngữ lớn (LLM), hiểu nó có thể giải quyết vấn đề gì một cách hiệu quả nhất. Ví dụ như lĩnh vực bán hàng là một lĩnh vực rất rộng, bao gồm các tương tác phức tạp giữa nhân viên và khách hàng, đại lý phân phối, cũng như các nền tảng khác nhau. Một trong những trường hợp điển hình về việc triển khai AI vào thực tế nằm ở việc tự động hóa quy trình tiếp cận khách hàng mới: những khách hàng tiềm năng có thể để lại thông tin liên lạc qua trang web, gian hàng tại hội nghị hoặc các kênh khác. Sau đó, thông thường sẽ cần gửi email cho họ. Nếu email chỉ đơn giản là giới thiệu sản phẩm một cách chung chung thì tỷ lệ chuyển đổi sẽ không cao. Tuy nhiên, việc viết email cá nhân hóa chính là điểm mạnh mà AI hiện nay có thể làm tốt. Việc tìm ra các tình huống phù hợp để nâng cao hiệu suất bằng cách sử dụng công nghệ AI trong lĩnh vực quen thuộc này đòi hỏi sự hợp tác chặt chẽ giữa chuyên gia kinh doanh và chuyên gia kỹ thuật để hoàn thành lần khớp nối đầu tiên giữa công nghệ và hoạt độ Trong quá trình này, vai trò của chuyên gia kỹ thuật là xây dựng hệ thống tự động hóa dựa trên dữ liệu cá nhân của từng khách hàng, từ đó tạo ra nội dung email phù hợp với nhu cầu riêng biệt của họ. Đồng thời, chuyên gia kinh doanh sẽ cung cấp insight sâu sắc về hành vi mua sắm của khách hàng và xu hướng thị trường, giúp đảm bảo rằng chiến lược marketing được tối ưu hóa đúng cách. Sự kết hợp giữa hai yếu tố này không chỉ làm tăng khả năng thành công mà còn tạo ra trải nghiệm tích cực hơn cho khách hàng tiềm năng. Ngoài ra, khi áp dụng AI vào các hoạt động kinh doanh, cần luôn xem xét các yếu tố đạo đức và quyền riêng tư. Việc thu thập và xử lý dữ liệu cá nhân phải tuân thủ các quy định pháp luật liên quan, chẳng hạn như GDPR ở châu Âu, để tránh gây rủi ro cho cả doanh nghiệp lẫn khách hàng. Điều này nhấn mạnh tầm quan trọng của việc cân bằng giữa đổi mới công nghệ và trách nhiệm xã hội trong quá trình phát triể
Bước tiếp theo cần suy nghĩ là Agent sẽ hiện diện trước người dùng mục tiêu dưới hình thức nào. Liệu một chatbot đơn thuần đã đủ? Hay chỉ cần thêm một lớp tương tác đơn giản với sự tham gia của con người trong vòng kiểm soát tự động hóa? Có thể cũng cần xem xét các tình huống phức tạp hơnđánh bài online, giống như trong bộ phim... Phân chia và tích hợp giữa AI sinh tạo và phần mềm truyền thống Tựa như mô hình IVERS được đề cập trong bài viết nàykeo 88, việc sản phẩm và người dùng cần thực hiện các lệnh phức tạp hơn, nhận phản hồi trực quan và tiếp tục tương tác nhiều vòng là điều bắt buộc? Chẳng hạn, trong lĩnh vực mã hóa AI, Cursor đã cung cấp một ví dụ điển hình về sản phẩm Agent chất lượng. Quy trình thiết kế ở cấp độ này đòi hỏi sự tham gia của các nhà quản lý sản phẩm AI chuyên nghiệp. Ví dụ cụ thể hơn, Cursor không chỉ đơn thuần là một công cụ mà còn là một nền tảng giúp lập trình viên tối ưu hóa thời gian và hiệu suất làm việc. Nó cho phép người dùng ra lệnh bằng ngôn ngữ tự nhiên và nhận kết quả ngay lập tức thông qua giao diện trực quan. Điều này tạo ra trải nghiệm liền mạch và tăng cường sự tương tác giữa con người và máy móc trong môi trường phát triển phần mềm. Để đạt được điều đó, các nhà quản lý sản phẩm AI cần phải hiểu rõ hành vi người dùng cũng như khả năng của công nghệ. Họ phải liên tục cải tiến và tối ưu hóa quy trình để đảm bảo sản phẩm đáp ứng đúng nhu cầu thị trường. Chính sự kết hợp giữa công nghệ tiên tiến và sự sáng tạo trong quản lý sản phẩm sẽ tạo nên những trải nghiệm tuyệt vời cho người dùng cuối cùng.
Tiếp theo là việc phân giải ở mức độ Agent. Điều này vẫn đang ở mức trừu tượng hóa quy trình kinh doanhtai ban ca, chứ chưa thực sự đi sâu vào công nghệ AI. Liệu toàn bộ quy trình cần tự động hóa có thể được chia nhỏ hơn nữa thành các tiểu quy trình chuyên biệt và rõ ràng hơn? Mỗi tiểu quy trình có thể được triển khai riêng lẻ dưới dạng một Agent, và mục tiêu tổng thể của toàn bộ quy trình có thể đạt được thông qua cách hợp tác giữa nhiều Agent. Việc phân tách các tiểu quy trình càng rõ ràng và cụ thể thì độ chính xác của các Agent AI tạo ra sẽ càng cao. Hãy nhìn lại ví dụ trước đó về kịch bản tiếp cận khách hàng trong lĩnh vực bán hàng. Tự động viết email marketing cá nhân hóa có thể chia thành hai bước: Bước đầu tiên là sử dụng dữ liệu từ thông tin khách hàng thu thập được kết hợp với tìm kiếm trên cơ sở dữ liệu nội bộ và internet công khai để tổng hợp thông tin và mô tả hồ sơ khách hàng (bao gồm cả bối cảnh, lĩnh vực hoạt động chính, hướng mở rộng kinh doanh mà họ đang quan tâm, v.v.). Bước thứ hai là dựa trên hồ sơ khách hàng đã hình thành từ bước trước, kết hợp với sản phẩm của mình để viết nội dung email cá nhân hóa. Tất nhiên, một sản phẩm tự động hoàn chỉnh cũng có thể tự động thực hiện bước cuối cùng, đó là gửi hàng loạt email. Công việc thiết kế ở cấp độ này thực sự rất quan trọng, nó nối liền tư duy với việc lập mô hình BPM (Quản lý Quy trình Kinh doanh) truyền thống và sắp xếp SOP (Thủ tục Vận hành Tiêu chuẩn). Nếu so sánh với mô hình phát triển phần mềm truyền thống, công việc này chính là kỹ thuật "công xảo" thuộc DDD (Thiết kế Hướng Đạo). Điều thú vị là khi áp dụng phương pháp này, chúng ta không chỉ cải thiện hiệu suất mà còn tăng cường khả năng thích nghi của hệ thống. Mỗi Agent có thể được tối ưu hóa cho nhiệm vụ cụ thể của nó, giúp giảm thiểu sai sót và tăng cường độ chính xác. Điều này cũng mở ra cánh cửa cho các cải tiến liên tục, vì mỗi Agent có thể được cập nhật và điều chỉnh riêng lẻ mà không làm ảnh hưởng đến toàn bộ hệ thống. Điều này đặc biệt hữu ích trong môi trường kinh doanh luôn thay đổi và phát triển nhanh chóng như hiện nay. Tuy nhiên, để đạt được điều này, việc xác định ranh giới và mục tiêu rõ ràng cho từng tiểu quy trình là vô cùng quan trọng. Một khi các ranh giới này không được xác định chính xác, sẽ dễ dẫn đến sự chồng chéo hoặc thiếu phối hợp giữa các Agent, từ đó làm giảm hiệu quả tổng thể. Vì vậy, việc phân tích kỹ lưỡng và thiết kế chặt chẽ trở thành yếu tố then chốt quyết định thành công của toàn bộ hệ thống. Trong thực tế, cách tiếp cận này không chỉ áp dụng cho ngành bán hàng mà còn có thể mở rộng sang nhiều lĩnh vực khác như dịch vụ khách hàng, sản xuất, và thậm chí là chăm sóc sức khỏe. Với sự phát triển không ngừng của công nghệ AI, việc áp dụng các phương pháp phân giải quy trình như thế này sẽ ngày càng trở nên phổ biến và quan trọng hơn bao giờ hết.
Building effective agents
Tiếp theo mới là mã ứng dụngđánh bài online, mã khung, mô hình LLM. Những thứ thực sự thuộc về công nghệ AI.
Khả năng trừu tượng chính là viên ngọc quý trên vương miện của tư duy cao cấp ở con người. Chính vì hiện tạikeo 88, các mô hình ngôn ngữ lớn (LLM) vẫn chưa thể tái tạo hoàn toàn những quá trình tư duy này của con người, nên việc thiết kế các đại diện AI (AI Agent) mới cần đến sự tham gia của các chuyên gia và kỹ sư. Những công việc này vốn dĩ rất phức tạp, và đối với một số "chuyên gia" vốn đã mơ hồ trong suy nghĩ, thì việc hiểu rõ tất cả các tầng trừu tượng này quả thực là một thử thách lớn. Do đó, việc khái niệm về thuật ngữ "Agent" còn mơ hồ và thiếu sự thống nhất giữa mọi người cũng dễ hiểu hơn. Những nhà phát triển cần phải vượt qua nhiều trở ngại để đưa ra các định nghĩa cụ thể hơn cho Agent, bởi đây không chỉ đơn thuần là một từ thông dụng mà còn liên quan đến việc xây dựng hệ thống phức tạp đòi hỏi sự phối hợp chặt chẽ giữa trí tuệ nhân tạo và trí tuệ con người. Điều này cũng cho thấy rằng, dù AI đang tiến bộ từng ngày, nhưng vẫn còn một chặng đường dài trước khi nó có thể tự mình nắm bắt được bản chất sâu sắc của những khái niệm trừu tượng mà con người đã dày công xây dựng qua nhiều thế kỷ.
Cuối cùngkeo 88, cho mình gửi một chút dự báo nhỏ: lần sau mình sẽ tập trung so sánh chi tiết về cách LangGraph và LlamaIndex thực hiện các tác vụ của Agent. Mình sẽ đi sâu vào những điểm tương đồng và khác biệt cũng như ưu nhược điểm giữa hai phương án này. Hãy cùng chờ đón nhé! Hẹn gặp lại ở bài viết tiếp theo.
PS: Khi đăng bài tiếp theođánh bài online, tôi có thể sẽ đổi ảnh đại diện. Mọi người đừng nhận nhầm tôi nhé ☺️
(kết thúc phần chính)
Các bài viết được chọn lọc khác :