Trí tuệ nhân tạo (AI), đặc biệt là Trí tuệ nhân tạo tạo sinh (GenAI), đang phát triển nhanh chóng. Tuy nhiên, giá trị mà nó mang lại vẫn phụ thuộc vào việc duy trì mức độ kiểm soát phù hợp trong hầu hết các trường hợp. Đó có thể là lý do tại sao nhiều công ty tìm kiếm một giải pháp đáng tin cậy. Dịch vụ GenAI nhà cung cấp để cải thiện tính khả thi của dự án và hỗ trợ sự hợp tác có ý nghĩa giữa con người và AI. Các phân tích tổng quan gần đây nêu bật những thách thức sau:
- Ít nhất 30% các sáng kiến GenAI có thể bị bỏ dở vào cuối năm 2025 do dữ liệu kém, kiểm soát rủi ro không đầy đủ và các trường hợp kinh doanh mơ hồ.
- Theo Gartner hơn 40% các dự án “AI tác nhân” có thể bị hủy bỏ vào năm 2027 do chi phí và giá trị kinh doanh không rõ ràng.
Giám sát yếu kém và giá trị không rõ ràng là một trong những giả thuyết hàng đầu dẫn đến sự trì trệ của các dự án AI. Một cách thiết thực để giải quyết cả hai vấn đề này là phương pháp tiếp cận con người trong vòng lặp (HITL) — một khuôn khổ đảm bảo sự tham gia của con người vào những yếu tố then chốt trong hệ thống AI, bao gồm cả phán đoán, đạo đức và bối cảnh. Trong bài viết hôm nay, chúng ta sẽ tìm hiểu ý nghĩa của HITL trong thực tế và cách áp dụng nó mà không làm giảm giá trị của các giải pháp AI hiện đại.
Hệ thống AI con người trong vòng lặp (HITL) là gì?
Vậy rốt cuộc “con người trong vòng lặp” là gì? Hệ thống HITL đặt con người vào các vị trí chiến lược trong chu trình ra quyết định của AI. Thay vì cho phép mô hình hoặc tác nhân tự động hành động ở mọi bước, hệ thống đề xuất một hành động hoặc phân loại. Sau đó, một con người được chỉ định sẽ xem xét, hiệu chỉnh hoặc phê duyệt.
Phản hồi của con người trở thành dữ liệu đào tạo giúp cải thiện hiệu suất trong tương lai. Các doanh nghiệp áp dụng khung HITL để giảm thiểu sai sót tốn kém, xử lý các trường hợp bất thường và điều chỉnh các quyết định AI phù hợp với giá trị của tổ chức. Mục tiêu không phải là quản lý vi mô mà là cân bằng giữa tự động hóa và phán đoán.
Ví dụ, hãy xem xét bộ phận hỗ trợ khách hàng. Hệ thống HITL cho phép trợ lý soạn thảo email hoàn tiền. Đối với các trường hợp thông thường, tin nhắn sẽ được gửi tự động. Giám sát viên sẽ xem xét bản thảo, điều chỉnh giọng điệu hoặc điều khoản, và phê duyệt hoàn tiền một phần hoặc các trường hợp ngoại lệ về chính sách. Mã chỉnh sửa, mã lý do và đường dẫn phê duyệt sẽ được ghi lại. Các bản thảo trong tương lai sẽ phản ánh những quy luật này. Do đó, số lượng tin nhắn cần xem xét sẽ ít hơn, trong khi các trường hợp nhạy cảm vẫn cần sự đánh giá của con người.
Vòng phản hồi HITL hoạt động như thế nào trong quy trình làm việc của tác nhân AI
Chu trình HITL thường diễn ra theo bốn giai đoạn sau:
- Mô hình AI phân tích dữ liệu và đưa ra kết quả.
- Người đánh giá sẽ đánh giá, phê duyệt hoặc chỉnh sửa bài viết.
- Hệ thống sẽ ghi lại phản hồi này.
- Các công cụ quản trị theo dõi chất lượng, tính nhất quán và sự thiên vị.
Trong mỗi bối cảnh, sự điều chỉnh có mục tiêu của con người sẽ giúp mô hình xử lý các trường hợp ngoại lệ và phát triển cùng với dữ liệu thực tế .
Lộ trình triển khai Con người trong vòng lặp (HITL)
Áp dụng phương pháp tiếp cận “con người trong vòng lặp” hiệu quả nhất khi thực hiện từng bước nhỏ, có thể đo lường được. Các tổ chức thường thấy kết quả tốt hơn khi triển khai HITL dần dần, bắt đầu với một lĩnh vực duy nhất có tác động lớn, rút kinh nghiệm từ kết quả và tiếp tục phát triển các khía cạnh khác từ đó:
Bước #1. Xác định phạm vi các trường hợp có tác động lớn
Tùy thuộc vào ngành nghề của bạn, hãy bắt đầu bằng cách xác định một quy trình mà các quyết định mang lại rủi ro hữu hình. Ví dụ, hãy xem xét phân loại hình ảnh y tế, phê duyệt khoản vay hoặc quản lý hoàn tiền. Xác định các hành động được tự động hóa hoàn toàn và các hành động được chuyển đến nhân viên. Đặt ngưỡng ban đầu theo điểm tin cậy, số tiền hoặc thẻ rủi ro. Liên kết với tác động kinh doanh: giảm phí thu hồi nợ, giảm sai sót lâm sàng, giảm thất thoát tiền hoàn trả.
Bước #2. Thí điểm và đo lường
Chạy một làn đánh giá (thử nghiệm có giới hạn) trong một miền. Ví dụ kinh doanh:
- Quản lý khoản vay: Chuyển các hồ sơ “ranh giới” đến các nhà phân tích tín dụng. Theo dõi độ chính xác của quyết định, thời gian xử lý và chất lượng hành động bất lợi.
- Chẩn đoán hình ảnh y tế: Gửi cảnh báo độ tin cậy thấp cho các bác sĩ X-quang. Theo dõi độ nhạy, tỷ lệ âm tính giả và thời gian đọc cho mỗi nghiên cứu.
- Xử lý hoàn tiền: Gửi bản thảo chính sách ngoại lệ cho trưởng nhóm. Theo dõi việc giải quyết ngay khi liên hệ lần đầu, thời gian xử lý trung bình và tỷ lệ khấu trừ.
Việc theo dõi tần suất can thiệp của con người, thời gian đánh giá và cách cải thiện kết quả sẽ giúp bạn định hình ngưỡng và quy tắc quản trị cho các bước và lần lặp lại tiếp theo.
Bước #3. Lặp lại và mở rộng quy mô
Tinh chỉnh lời nhắc, quy tắc và ngưỡng dựa trên kết quả đánh giá. Khi mô hình ổn định và các chỉ số được cải thiện, hãy giảm dần tần suất đánh giá thủ công, ví dụ: chỉ lấy mẫu 25% trường hợp cận lâm sàng sau hai tuần ổn định thay vì 100%. Mục tiêu là mở rộng tự động hóa một cách thận trọng, khi hiệu suất vẫn ổn định và rủi ro ổn định, đồng thời mở rộng quy mô đến những khu vực có lợi ích quan sát được.
Bước #4. Thể chế hóa quản trị
Ghi lại việc lưu giữ dữ liệu, vai trò của người đánh giá, lộ trình leo thang và phản hồi sự cố khi quy trình HITL hoàn thiện. Triển khai thử nghiệm thiên vị, theo dõi kiểm toán và kiểm tra tính công bằng trên các thuộc tính nhạy cảm, chẳng hạn như các lớp được bảo vệ và nhật ký sẵn sàng cho cơ quan quản lý. Các biện pháp này giúp các quyết định có thể truy xuất nguồn gốc và chịu trách nhiệm, dù là đối với cơ quan quản lý tài chính, kiểm toán viên y tế hay hội đồng đạo đức nội bộ.
Bước #5. Tối ưu hóa chi phí
Cuối cùng, hãy theo dõi chi phí đánh giá thủ công so với chi phí cho lỗi và rủi ro mà chúng giúp giảm thiểu. Bước này sẽ cung cấp cho bạn đủ thông tin chi tiết để quyết định khi nào nên giảm quy mô đánh giá thủ công hoặc đầu tư vào đào tạo có mục tiêu. Khối lượng công việc của con người sẽ giảm dần theo thời gian, khi độ tin cậy của mô hình tăng lên, cho đến khi đạt được sự cân bằng giữa hiệu quả của hệ thống và nhu cầu giám sát của con người.
Bằng cách tiếp cận HITL như một quá trình học tập lặp đi lặp lại và mở rộng dần dần, các tổ chức có thể phát triển các biện pháp bảo vệ khi hệ thống của họ trưởng thành, triển khai tự động hóa theo cách phù hợp với kỳ vọng thực tế, các yêu cầu tuân thủ và nhu cầu kinh doanh.
Khi nào các tổ chức nên cân nhắc tự động hóa AI có sự tham gia của con người
Trên thực tế, việc áp dụng phương pháp HITL là hợp lý nhất khi chi phí rủi ro, sự không chắc chắn hoặc hậu quả nghiêm trọng trong trường hợp xảy ra lỗi lớn hơn lợi ích của việc tự động hóa hoàn toàn. Hãy tự kiểm tra một chút để hiểu liệu có cần sự giám sát của con người trong trường hợp của bạn hay không:
Quyết định có thể được đảo ngược không?
Một sai lầm sẽ khiến bạn phải trả giá như thế nào?
Quá trình này có yêu cầu bằng chứng kiểm toán không?
Nếu bất kỳ câu trả lời nào nêu ra mối lo ngại, bạn nên duy trì sự giám sát của con người trong quy trình làm việc của mình — ít nhất là cho đến khi chất lượng được cải thiện đủ để hỗ trợ tự động hóa tốt hơn. Tuy nhiên, một số lĩnh vực nhất định gần như luôn được hưởng lợi từ việc cập nhật thông tin cho mọi người:
- Bối cảnh được quy định hoặc đạo đức . Các quyết định về tài chính, chăm sóc sức khỏe, tuyển dụng và pháp lý phải tuân thủ các hướng dẫn nghiêm ngặt và yêu cầu về công bằng.
- Tương tác nhạy cảm với thương hiệu . Tương tác với khách hàng và truyền thông công cộng có thể gây tổn hại đến lòng tin nếu xử lý sai cách.
- Sai lầm tốn kém . Lỗi định giá, phê duyệt gian lận hoặc vi phạm dữ liệu có thể gây ra thiệt hại về tài chính và uy tín.
- Dữ liệu lộn xộn hoặc mơ hồ. Tài liệu được quét, nhật ký cảm biến và nội dung do người dùng tạo ra thường cần sự diễn giải của con người.
- Kiểm tra sự thiên vị và tính công bằng . Quan điểm đa dạng của con người giúp phát hiện và giảm thiểu sự thiên vị của thuật toán, đồng thời chỉ ra những điểm mù mà các mô hình AI có thể bỏ sót.
Nguyên tắc chung: Nếu hành động khó đảo ngược, tốn kém để khắc phục, hoặc phải giải thích với cơ quan quản lý, hãy để con người theo dõi và/hoặc sử dụng phần mềm giám sát con người . Khối lượng đánh giá sẽ giảm dần khi dữ liệu, lời nhắc và chính sách được hoàn thiện, nhưng việc lấy mẫu, kiểm toán và các phương thức kháng cáo nên luôn được áp dụng để duy trì trách nhiệm giải trình.
Ayai có thể hỗ trợ phát triển AI có trách nhiệm như thế nào ?
Việc tích hợp giám sát của con người vào tự động hóa quy trình làm việc không chỉ là một bước tiến kỹ thuật mà còn là một cách xây dựng niềm tin, trách nhiệm giải trình và giá trị lâu dài trong các giải pháp agentic. Tại Ayai, chúng tôi hợp tác với khách hàng để thiết kế các phương pháp HITL cân bằng giữa tự động hóa và đánh giá của con người theo cách phản ánh mục tiêu và hạn chế của từng tổ chức:
- Khung tư vấn và rủi ro . Hợp tác với các nhóm của chúng tôi để xác định các cổng đánh giá, mô hình quản trị và quy trình ứng phó sự cố phù hợp với các tiêu chuẩn ngành và hướng dẫn về AI có đạo đức.
- Kỹ thuật và tích hợp . Con người trong vòng lặp giải pháp học máy (ML) Cải thiện độ chính xác, độ tin cậy và khả năng thích ứng của mô hình. Trong quá trình này, chúng tôi hợp tác với khách hàng để nhúng các quy trình đánh giá, truy xuất và các lớp điều phối trực tiếp vào quy trình làm việc AI, giải quyết các vấn đề mà máy móc còn thiếu hiểu biết về ngữ cảnh.
- Hỗ trợ vận hành . Dữ liệu giám sát hữu ích nhất khi nó thúc đẩy cải tiến liên tục. Đội ngũ của chúng tôi hỗ trợ bạn thiết kế hàng đợi, bảng thông tin và vòng lặp phản hồi, biến thông tin đầu vào của người đánh giá thành thông tin chi tiết có cấu trúc, hỗ trợ tinh chỉnh có giám sát và học tăng cường từ phản hồi của con người (RLHF).
- Hướng dẫn quyết định thực tế . Chúng tôi tư vấn cho bạn những cách khác nhau để cải thiện quy trình làm việc hiện có trong công ty hoặc tổ chức của bạn, cho dù đó là quyết định giữa xây dựng hoặc mua một chatbot AI, lựa chọn một cách tối ưu mô hình kiến trúc đám mây, xác định phạm vi MVP AI hoặc bất cứ thứ gì ở giữa.
MỘT đối tác phát triển AI có trách nhiệm giúp đảm bảo rằng giám sát trở thành yếu tố hỗ trợ chứ không phải là hạn chế: biến dữ liệu đánh giá thành tín hiệu học tập, lồng ghép tính minh bạch và giúp các nhóm mở rộng quy mô tự động hóa một cách tự tin và kiểm soát.
Cân bằng giữa đổi mới và trách nhiệm giải trình
AI hứa hẹn sẽ định hình lại cách thức hoạt động của doanh nghiệp, tuy nhiên nhiều dự án lại gặp khó khăn vì:
- Chi phí cao;
- Chất lượng dữ liệu kém;
- Giá trị kinh doanh không rõ ràng.
Trong một thế giới mà các hệ thống AI ngày càng đưa ra quyết định thay mặt doanh nghiệp, thành công thuộc về các công ty kết hợp đổi mới công nghệ với quản trị có trách nhiệm. Phần mềm tự động hóa vòng lặp con người không phải là rào cản cho sự tiến bộ. Nó biến AI thành một đối tác đáng tin cậy bằng cách kết hợp tự động hóa với đánh giá có mục tiêu của con người.
Bằng cách áp dụng chiến lược một cách thận trọng và hợp tác với các nhà cung cấp, tổ chức và doanh nghiệp giàu kinh nghiệm, bạn có thể khai thác tối đa tiềm năng của AI đại diện trong khi vẫn giữ vững quyền kiểm soát trong tay con người. Nếu đó là con đường bạn đang khám phá, liên hệ với chúng tôi để thảo luận chi tiết hơn về các phi công tiềm năng.
