Vì Sao AI Công Nghiệp Cần Ngữ Cảnh, Không Chỉ Một Mô Hình
Ai đó trong nhóm của bạn đã chạy demo. Họ gõ một câu hỏi vào chatbot — *đơn hàng nào của chúng ta đang rủi ro tuần này?* — và nó trả lời trong hai giây, bằng câu hoàn chỉnh, với sự tự tin tuyệt đối. Cả phòng gật đầu. Rồi một người thực sự vận hành dưới xưởng đọc kỹ câu trả lời và lặng đi. Hai trong số các đơn nó nêu đã giao thứ Sáu tuần trước. Đơn thực sự đang cháy thì không hề có trong danh sách.
Mô hình không hỏng. Nó là một mô hình rất tốt — tốt hơn, theo mọi thước đo benchmark, so với bất cứ thứ gì bạn có thể mua được hai năm trước. Vấn đề là nó đang trả lời một câu hỏi về *operation của bạn* trong khi không thể nhìn thấy nó. Nó có ngôn ngữ. Nó không có sự thật. Nên nó làm điều mà một hệ thống lưu loát nhưng không có nền tảng luôn làm: tạo ra một phỏng đoán tự tin, được viết khéo.
Một mô hình thông minh hơn mà không thấy được operation của bạn thì chỉ đoán nhanh hơn.
Đây là cái bẫy mà AI công nghiệp cứ bước vào, và là lý do quá nhiều lần triển khai khựng lại sau demo. Chúng ta cứ coi mô hình là sản phẩm. Mô hình là *động cơ*. Cái vận hành một operation là động cơ cộng với ngữ cảnh được kết nối mà nó suy luận trên đó — và gần như không ai thiếu động cơ. Họ thiếu ngữ cảnh. Chúng tôi đã lập luận trường hợp rộng trong Ontology: Hệ Điều Hành Cho Các Quyết Định; bài này nêu trường hợp sắc hơn: vì sao một mô hình đơn lẻ không thể vận hành operation, và vì sao kiến trúc bền vững là *một ontology, nhiều mô hình*.
Trả lời trực tiếp:
AI công nghiệp thất bại khi nó thiếu ngữ cảnh vận hành, không phải khi mô hình yếu. Một mô hình suy luận về ngôn ngữ, nhưng nó không thể thấy đơn hàng, vật liệu, máy móc, và khách hàng của bạn kết nối ra sao — điều đó nằm trong operation của bạn. Nối cùng mô hình đó vào một ontology được kết nối và nó trở nên hữu dụng. Kiến trúc bền vững là một ontology, nhiều mô hình.
Vì sao một mô hình tốt hơn không sửa được điều này
Hãy bắt đầu từ phần mà ai cũng hiểu ngược. Phản xạ sau một câu trả lời tệ — *nếu nó đoán sai, lấy mô hình thông minh hơn* — chỉ đúng hướng ngược lại, và chính các con số của ngành nói vậy. NTT DATA báo cáo rằng từ 70% đến 85% các nỗ lực triển khai AI tạo sinh không đạt được ROI mong muốn. Và RAND, trong báo cáo *The Root Causes of Failure for AI Projects*, phát hiện rằng hơn 80% dự án AI thất bại — khoảng gấp đôi tỷ lệ thất bại của các dự án CNTT không phải AI, với nguyên nhân hàng đầu là hiểu sai mục tiêu cùng các vấn đề dữ liệu và ngữ cảnh, *không phải* một mô hình chưa đủ thông minh. Các thất bại tụ lại ở lớp xung quanh mô hình, không phải bên trong nó — đó là tin tốt, vì lớp đó chính là phần bạn có thể xây.
Đi theo logic và bạn sẽ thấy vì sao. Một mô hình biết hai loại thứ: điều nó học trong lúc huấn luyện, và bất cứ gì bạn đưa cho nó ngay lúc bạn hỏi. Nó đã học ngôn ngữ và cách một chuỗi cung ứng hoạt động *nói chung*. Điều nó không thể nào học được là đơn nào của *bạn* đang thiếu vật liệu nào, nhà cung cấp nào đang trượt, và khách hàng nào không thể nhận giao trễ — không gì trong số đó nằm trong dữ liệu huấn luyện của nó, và không gì nằm trong câu hỏi "đơn nào đang rủi ro?" Nên nó lấp khoảng trống bằng một mẫu hình hợp lý thay vì sự thật của bạn.
Làm mô hình thông minh gấp đôi và không gì thay đổi. Nó vẫn không thấy được mức tồn kho chưa từng được cho xem — nó chỉ tạo ra một phỏng đoán hùng hồn hơn, nhanh hơn, mà có thể nói là tệ hơn, vì sự hùng hồn là thứ khiến một câu trả lời sai được tin trong cuộc họp. Nút thắt chưa bao giờ là trí thông minh của mô hình; nó là sự *mù* của mô hình với operation của bạn, và bạn không sửa cái mù bằng một bộ não lớn hơn. Bạn sửa nó bằng cách nối đôi mắt. Đó là kết quả khám nghiệm trên hầu hết các dự án AI công nghiệp bị khựng: *mô hình không thấy được operation, nên đầu ra của nó không thể tin được, nên người ta lặng lẽ ngừng dùng.* Bản thử nghiệm nhận được vỗ tay, rồi chết trong production — không phải vì động cơ hỏng, mà vì không ai nối nó với con đường.
"Ngữ cảnh" ở đây thật ra nghĩa là gì
"Ngữ cảnh" bị dùng lỏng lẻo, nên hãy làm nó cụ thể. Với một operation công nghiệp, nó có nghĩa là ba thứ mà mô hình cần và gần như không bao giờ có.
Trạng thái được kết nối của operation, ngay lúc này. Không phải bản xuất của quý trước. Các liên kết sống: đơn nào đang mở, chúng cần gì, có gì trong nhà máy, lệnh sản xuất nào đang chạy, dưới xưởng sản xuất được gì ca này, lô giao nào đã cam kết cho khách nào. Đây là operational ontology — mô hình được kết nối của các đối tượng, thuộc tính, mối quan hệ, và hành động. (Đó là lý do lưu các dòng trong một warehouse không giống với hiểu chúng — xem operational ontology so với data warehouse.) Không có nó, mô hình suy luận về một operation nó chưa từng thấy.
Logic của doanh nghiệp bạn. Các quy tắc bạn mang trong đầu: khách này không chịu được trượt, vật liệu này có lead ba tuần, một độ lệch chất lượng vượt ngưỡng này nghĩa là dừng. Một mô hình tổng quát không biết ràng buộc nào của bạn. Viết vào ontology một lần, chúng áp dụng mỗi lần — nên mô hình suy luận với quy tắc của *bạn*, không phải quy tắc chung.
Các động từ — điều nó được phép làm. Ngữ cảnh không chỉ là điều mô hình có thể thấy; nó là điều mô hình có thể *làm* về việc đó. Đặt lại vật liệu, mở một nhiệm vụ cho owner, sắp lại dây chuyền, báo nhà cung cấp — mỗi cái ghi ngược lại vào hệ thống thật của bạn, với bản ghi ai làm gì. Một mô hình với ngữ cảnh chỉ-đọc là một báo cáo thông minh hơn; một mô hình có hành động khép kín vòng từ "cái này đang trượt" thành "đây là nước đi, kèm owner và một ngày."
Ghép ba thứ đó lại và mô hình ngừng liên tưởng tự do và bắt đầu suy luận trên operation thực của bạn. Cùng một mô hình, đầu ra hoàn toàn khác.
Khoảng trống ngữ cảnh lộ ra như thế nào
Trong thực tế, "mô hình không thấy được operation" mặc bốn lớp ngụy trang dễ nhận, và nếu bản thử nghiệm AI của bạn chết thì nó chết vì một trong số đó. Nó sai một cách tự tin về các chi tiết riêng của bạn — sai một cách *thuyết phục*, nên ảo giác được lặp lại trong cuộc họp như sự thật. Nó không tự giải thích được — hỏi vì sao nó nêu một đơn và nó chỉ phẩy tay về phía các mẫu hình, "có vẻ rủi ro cao." Nó trả lời nhưng không hành động được — nó đọc nhưng không ghi ngược lại, nên một con người vẫn phải tự mở bốn hệ thống; bạn đã thêm một người tường thuật, không phải một người làm việc. Và nó chạy trong demo và chết trong production — demo chạy trên một lát cắt sạch được chuẩn bị bằng tay, production chạy trên tồn kho cũ và các trường điền nửa vời.
Mỗi cái đều là một thất bại ngữ cảnh được hóa trang thành thất bại mô hình — đó là lý do một mô hình mới hơn rất hiếm khi cứu được một lần triển khai bị khựng, còn nối operation thì lại thường xuyên cứu được. Hai tư thế đặt cạnh nhau:
| AI không có ngữ cảnh vận hành | AI trên ontology | |
|---|---|---|
| Nó đọc gì | Một bản xuất phẳng — các dòng không có liên kết sống | Trạng thái được kết nối của operation sống |
| Chất lượng câu trả lời | Hợp lý, chung chung, thường sai ở chi tiết | Cụ thể và đúng với operation của bạn |
| Tự giải thích được không? | Không — chỉ "có vẻ rủi ro cao" | Có — truy câu trả lời ngược về sự thật thực |
| Hành động được không? | Không — đưa bạn một câu, bạn mở bốn hệ thống | Có — mở nhiệm vụ kèm owner và một ngày |
| Sống được trong production? | Không — vỡ ngay khi dữ liệu trở nên lộn xộn | Có — xây trên operation thật, lộn xộn |
Một ví dụ thực tế: cùng một mô hình, hai lần
Các con số minh họa — không phải sổ sách của khách hàng — nhưng độ tương phản đúng y như những gì chúng tôi thấy khi lớp ngữ cảnh được đưa vào. Bạn hỏi cùng một câu cả hai lần: *rủi ro giao hàng lớn nhất tuần này là gì, và chúng ta nên làm gì về nó?*
Không có ngữ cảnh vận hành, mô hình nhận một bản xuất phẳng — một danh sách đơn hàng, một bản dump tồn kho riêng, không cái nào được liên kết. Nó suy luận từ các mẫu hình chung và chọn DC-1109 vì đó là con số lớn nhất nó thấy được, và "đơn lớn = rủi ro" là hợp lý. Nhưng DC-1109 đã giao thứ Năm, và đơn thực sự đang cháy — DC-1042, thiếu 560 mét nylon với một nhà cung cấp chậm — không được nhắc đến, vì sự thiếu hụt nằm trong một kết nối chưa bao giờ được đấu nối.
```mock
ungrounded-answer
```
Với ngữ cảnh vận hành, cùng mô hình đó suy luận trên ontology và đi theo chuỗi — DC-1042 cần 2.400 m nylon, tồn kho giữ 1.840, tức là thiếu 560 m so với lead 14 ngày, một nhà cung cấp đang trượt, và một khách hàng không chịu được trượt. Nên nó trả về câu trả lời thực sự đúng. Và vì hành động là một phần của ngữ cảnh, nó không dừng ở lời khuyên: nó mở nhiệm vụ, kèm owner và ngày cần, trong hệ thống mà người lập kế hoạch vốn đã làm việc.
```mock
grounded-answer
```
Bài học không hề tinh vi: động cơ giống hệt cả hai lần. Giá trị đến từ việc nối nó với một mô hình của operation — để nó có thể thấy sự thiếu hụt, giải thích nó trong một chuỗi mà con người kiểm tra được, và chuyển cách sửa tới một owner kèm một ngày.
Một ontology, nhiều mô hình
Đây là kiến trúc bền vững, và lý do để không bao giờ đặt cược operation của bạn vào một mô hình duy nhất. Mô hình thay đổi vài tháng một lần — một cái mới ra, rẻ hơn hoặc sắc hơn ở một tác vụ nào đó, và cái được ưa của quý trước bỗng thành hạng nhì. Nếu trí tuệ của operation bị hàn chặt vào một mô hình cụ thể, mỗi lần đổi mô hình trở thành một dự án di trú, và bạn cứ mãi xây trên cát.
Thiết kế bền vững đảo ngược điều đó. Bạn xây ngữ cảnh vận hành *một lần* — một ontology, mô hình được kết nối của operation — và để nó là nền đất ổn định mà nhiều mô hình cắm vào. Một mô hình suy luận xếp hạng rủi ro của tuần này. Một mô hình rẻ hơn soạn email nhà cung cấp. Một mô hình thị giác đọc một camera dưới xưởng và biến nó thành một tín hiệu mà ontology có thể hành động trên đó. Mỗi cái giỏi một việc khác nhau; mỗi cái suy luận trên *cùng* ngữ cảnh được kết nối; mỗi cái có thể được thay bằng cái tốt hơn vào quý sau mà không quấy nhiễu nền móng bên dưới.
Đó là *một ontology, nhiều mô hình.* Ontology là tài sản bạn sở hữu và bồi đắp; các mô hình là những động cơ thay thế được mà bạn hướng vào nó. Làm đúng nền móng đó và các mô hình tự lo cho mình. Làm sai và mô hình tốt nhất trên đời vẫn đoán.
MIDAS nằm ở đâu
Hình hài thực tế của tất cả những điều này: MIDAS là lớp trí tuệ công nghiệp xây operational ontology và để lựa chọn mô hình của bạn suy luận trên đó. (Đây là cách nó lắp lớp đó lên trên các hệ thống bạn đang chạy.)
Chúng tôi không xây lại hệ thống của bạn — chúng tôi kết nối dữ liệu của bạn và đặt AI lên trên.
ERP, MES, công cụ dự án, bảng tính, cảm biến, camera của bạn, và phần messaging nơi các cập nhật thật diễn ra — tất cả đều giữ nguyên. Một forward-deployed engineer vẽ ra cách operation của bạn chạy, đấu nối ngữ cảnh được kết nối mà các mô hình cần, và gắn các hành động ghi ngược lại vào hệ thống của bạn. Một hệ thống. Một ontology. Nhiều mô hình ở trên, thay được khi chúng cải thiện. Vì AI project management là hạng mục ngân sách mà hầu hết các operator vốn đã nhận ra, ontology thường được xây bên dưới một lần triển khai AI project management — chính là ứng dụng thất bại khi thiếu ngữ cảnh vận hành, vì một công cụ dự án không thấy được vật liệu đã về hay chưa thì chỉ là một danh sách nhiệm vụ đẹp hơn. Cùng nền tảng đó là thứ cho phép Production Intelligence biến một tín hiệu dưới xưởng thành một quyết định thay vì một biểu đồ nữa.
Hãy rõ ràng về lằn ranh con người, vì đó là lằn ranh quan trọng nhất: hệ thống nêu lên cái gì đang rủi ro, xếp hạng nó, và đề xuất nước đi tiếp theo kèm owner và một ngày. *Con người quyết định.* Nó đưa cho nhóm của bạn lời cảnh báo khi vẫn còn thời gian để dùng — nó không cầm vô lăng. Nối mô hình vào operation của bạn không phải là gỡ bỏ phán đoán của các operator; mà là tha cho phán đoán đó khỏi việc đối chiếu các con số và dành nó cho những quyết định chỉ con người mới làm được.
Tóm lại
Cuộc trò chuyện về AI công nghiệp đã mắc kẹt ở sai danh từ. Nó cứ hỏi mô hình nào tốt nhất, trong khi các operation thu được giá trị đã hỏi một câu khác trước: *một mô hình cần thấy gì, và làm gì, để hữu dụng ở đây?* Câu trả lời là ngữ cảnh vận hành — một ontology được kết nối, logic doanh nghiệp của bạn, và các động từ để hành động. Xây nó một lần, để nhiều mô hình đứng trên nó, và một mô hình đủ-tốt được nối vào operation của bạn sẽ thắng mô hình tốt nhất thế giới suy luận trên một bản xuất phẳng. Mọi lúc.
Câu hỏi thường gặp
Vì sao quá nhiều dự án AI công nghiệp thất bại?
Không phải vì các mô hình yếu — hầu hết các nhóm đều dùng cùng những mô hình xuất sắc. RAND phát hiện hơn 80% dự án AI thất bại, khoảng gấp đôi tỷ lệ của các dự án CNTT không phải AI, với nguyên nhân hàng đầu là hiểu sai mục tiêu cùng các vấn đề dữ liệu và ngữ cảnh. Mô hình không thấy được operation, nên nó đoán sai, người ta ngừng tin nó, và bản thử nghiệm chết trong production.
Một mô hình thông minh hơn hoặc mới hơn sẽ sửa được kết quả AI tệ chứ?
Thường là không. Một mô hình thông minh hơn vẫn không thấy được mức tồn kho hay độ trễ nhà cung cấp chưa từng được cho xem — nó chỉ tạo ra một phỏng đoán hùng hồn hơn, nhanh hơn, khiến các câu trả lời sai dễ tin hơn. Cách sửa là nối mô hình vào operation của bạn qua một ontology, để nó suy luận trên sự thật thực của bạn thay vì các mẫu hình chung.
"Ngữ cảnh vận hành" thật ra nghĩa là gì?
Ba thứ mà một mô hình gần như không bao giờ tự có: trạng thái sống được kết nối của operation (đơn nào cần gì, có gì trong kho, dưới xưởng sản xuất được gì), logic của doanh nghiệp bạn (khách này không chịu được trượt, vật liệu này có lead ba tuần), và các hành động nó được phép làm (đặt lại, sắp lại, mở một nhiệm vụ) ghi ngược lại vào hệ thống của bạn.
"Một ontology, nhiều mô hình" nghĩa là gì?
Bạn xây mô hình được kết nối của operation một lần — ontology — và để nó là nền móng ổn định mà nhiều mô hình cắm vào: một cái để xếp hạng rủi ro, một cái để soạn tin nhắn, một cái để đọc feed camera, mỗi cái thay được khi cái tốt hơn ra mắt. Ontology là tài sản bạn sở hữu và bồi đắp; các mô hình là những động cơ thay thế được hướng vào nó.
Tôi có cần chọn mô hình AI hoàn hảo trước không?
Không — đó là câu hỏi đầu tiên sai. Bất kỳ mô hình có năng lực nào cũng hữu dụng một khi nó thấy được operation của bạn và hành động trên đó, và vô dụng khi nó không thấy. Xây ngữ cảnh vận hành trước; lựa chọn mô hình khi đó trở nên dễ đưa ra và dễ thay đổi.
Điều này khác gì với việc thêm một chatbot vào dữ liệu của chúng tôi?
Một chatbot trên một bản xuất phẳng đọc các dòng nhưng không theo được cách mọi thứ kết nối, nên nó không thể nói đơn nào thực sự đang rủi ro hay làm bất cứ điều gì về nó. Nối cùng mô hình đó vào một ontology cho phép nó suy luận xuyên suốt cả operation — và các hành động khép kín vòng, biến "cái này đang trượt" thành một nhiệm vụ kèm owner và một ngày.
Cho AI của bạn một operation mà nó có thể thấy
Mô hình không phải là vấn đề của bạn — ngữ cảnh đang thiếu mới là. Chúng tôi sẽ vẽ ra một quyết định mà AI của bạn cứ làm sai, chỉ cho bạn operational ontology nó cần để làm đúng, và xác định phạm vi những gì cần để kết nối các hệ thống bạn đang chạy. Đặt một buổi đánh giá lớp trí tuệ.