Những năm gần đây, cụm từ vibe coding liên tục được nhắc tới trong cộng đồng công nghệ. Khái niệm này mô tả việc “lập trình bằng diễn đạt ý tưởng”: người dùng mô tả ứng dụng mình muốn và AI tự động sinh code. Theo Harvard Gazette, vibe coding là “tạo phần mềm với sự hỗ trợ của AI – thậm chí bạn không nhất thiết phải hiểu đoạn mã được sinh ra”. Thuật ngữ này do Andrej Karpathy phổ biến vào tháng 2 năm 2025 và nhanh chóng trở thành trào lưu.

Tuy nhiên, sự tiện lợi của vibe coding cũng đi kèm rủi ro. Karen Brennan (ĐH Harvard) chỉ ra rằng trách nhiệm hiểu và kiểm soát mã nguồn là điều phân biệt giữa lập trình chuyên nghiệp và vibe coding; nếu bỏ qua điều này, người dùng dễ bị “đánh lừa” bởi những kết quả trông có vẻ đúng. Để khai thác AI hiệu quả mà vẫn đảm bảo tính đúng đắn, hai trụ cột đã xuất hiện trong thế hệ công cụ mới: ontology (bản đồ tri thức) và harness engineering (bộ khung điều khiển). Bài viết này sẽ phân tích sâu hai khái niệm này và cách chúng nâng tầm vibe coding.
1. Vibe Coding – Từ ý tưởng tới sản phẩm
Vibe coding mang lại khả năng xây dựng ứng dụng nhanh chóng nhờ AI. Nó cho phép những người không biết lập trình mô tả mong muốn bằng ngôn ngữ tự nhiên và nhận lại một sản phẩm chạy được. Karen Brennan mô tả vibe coding là “giải phóng người dùng khỏi việc hiểu đoạn mã được sinh ra”. Điều này tạo nên sự “tự do” nhưng cũng dẫn tới hai vấn đề lớn:
- Không kiểm soát được logic: Người dùng khó đánh giá AI đã hiểu đúng ý định hay chưa.
- Thiếu bối cảnh và quy tắc: Khi AI tự sinh code, nó dựa trên tri thức chung. Nếu không có bối cảnh cụ thể (bộ quy tắc ngành, định nghĩa thuật ngữ, dữ liệu doanh nghiệp), AI dễ mắc lỗi.
Chính vì vậy, cộng đồng đã phát triển thêm các thành phần bổ trợ để biến vibe coding thành quy trình nghiêm túc: ontology giúp AI hiểu ngữ nghĩa miền nghiệp vụ, và harness đảm bảo việc thực thi an toàn và có thể kiểm chứng.
2. Ontology – Bản đồ tri thức cho AI
2.1 Khái niệm và vai trò
Theo Priyanka Jain, ontology là “biểu diễn kiến thức dạng chính thức – một bản đồ có cấu trúc của các khái niệm, mối quan hệ và quy tắc trong một lĩnh vực”. Trước đây, ontology được xem như tài liệu tham khảo dành cho con người, nhưng trong kỷ nguyên tác nhân AI, nó trở thành “tập hướng dẫn có thể thực thi” giúp agent suy luận và hành động.
Ontology đóng vai trò mỏ neo ngữ nghĩa cho AI trong quá trình vibe coding:
- Giảm mơ hồ: Ai agent hiểu rõ “khách hàng”, “đơn hàng”, “giao dịch” là gì, mối quan hệ và các quy tắc liên quan, thay vì chỉ đoán dựa trên tên cột dữ liệu.
- Định nghĩa chuẩn: Ontology giúp đồng bộ ngôn ngữ giữa các bộ phận; “doanh thu” có định nghĩa duy nhất, tránh mỗi phòng ban hiểu khác nhau.
- Kích hoạt khả năng suy luận: Với ontology, AI có thể suy luận các mối quan hệ và tuân thủ quy tắc nghiệp vụ (ví dụ, một khách hàng không thể có hợp đồng khi bị cấm), thay vì đơn thuần phản hồi theo mẫu.
2.2 Lợi ích thực nghiệm
Nhiều nghiên cứu cho thấy việc bổ sung lớp ontology giúp AI chính xác hơn rõ rệt. Trong thí nghiệm của Moveworks và Snowflake, độ chính xác chuyển ngữ truy vấn văn bản sang SQL chỉ ở mức 10–31 % khi dùng “raw context” (danh sách schema), nhưng tăng vọt lên 94–99 % khi dùng “governed context” – một lớp ontology có định nghĩa và lineage đi kèm. Nghiên cứu này còn ghi nhận thêm 20 % độ chính xác và giảm 39 % chi phí gọi tool khi thêm lớp ontology. Những con số này chứng minh rằng dữ liệu có cấu trúc ngữ nghĩa không chỉ giúp AI hiểu đúng mà còn tối ưu tài nguyên.
2.3 Khoảng cách giữa raw context và governed context
Atlan phân biệt hai cấp độ dữ liệu cung cấp cho AI:
- Raw context: chỉ gồm schema hoặc embedding thô, mô tả cấu trúc nhưng không nêu ý nghĩa.
- Governed context: mở rộng raw context bằng định nghĩa được chứng nhận, lineage, hợp đồng dữ liệu và quyền truy cập. Nó cho AI biết “doanh thu ròng” nghĩa là gì, ai sở hữu, và dữ liệu đó được chứng nhận khi nào.
Một harness chỉ hoạt động tốt khi đọc được governed context. Nếu dùng raw context, AI dễ rơi vào “context rot” – các định nghĩa cũ hoặc sai lệch khiến agent đưa ra quyết định sai. Do đó, xây dựng và duy trì ontology là bước bắt buộc khi áp dụng vibe coding vào các hệ thống thực tế.
3. Harness Engineering – Bộ khung điều khiển AI
3.1 Định nghĩa và thành phần
Theo Atlan, harness engineering là kỷ luật thiết kế hệ thống kiểm soát để quản lý cách một agent AI nhận thức môi trường, chọn hành động và xác minh kết quả. Điều này khác với prompt engineering (viết hướng dẫn cho từng lượt) và lựa chọn mô hình; harness là mọi thứ bao quanh mô hình, bao gồm:
- Guides (hướng dẫn): các file prompt hệ thống, AGENTS.md, tài liệu ràng buộc… nhằm định nghĩa những gì agent được phép và phải làm.
- Sensors (cảm biến): các bộ đánh giá, vòng lặp kiểm thử, trình phân tích để quan sát và phát hiện sai sót.
- Lớp ngữ cảnh (data context layer): nguồn dữ liệu có chứng nhận, được quản trị, cung cấp cho agent suy luận.
- Logic điều phối: sắp xếp luồng nhiệm vụ và tuyến đường trả kết quả.
Martin Fowler khẳng định “harness là tất cả những gì của một agent ngoại trừ bản thân mô hình” và nhắc lại công thức Agent = Model + Harness. Một harness tốt giúp tăng khả năng agent tạo ra kết quả đúng ngay lần đầu và cung cấp vòng phản hồi tự sửa lỗi, từ đó giảm khối lượng đánh giá thủ công và lãng phí token.
3.2 Phân loại hướng dẫn và cảm biến
Fowler chia guides và sensors thành hai loại:
- Hướng dẫn feedforward: chạy trước khi agent hành động để định hướng; ví dụ, AGENTS.md quy định file nào được chỉnh sửa, bộ quy tắc coding, quy trình review.
- Cảm biến feedback: chạy sau khi agent hành động nhằm quan sát và yêu cầu sửa lỗi; ví dụ, linter, test tự động, agent review.
Nếu chỉ có feedback, agent sẽ lặp lại lỗi cũ; nếu chỉ có feedforward, agent không biết mình có làm đúng không. Kết hợp cả hai giúp hệ thống tự điều chỉnh liên tục.
3.3 Sự ra đời của harness engineering
OpenAI đã thực hiện một thí nghiệm nội bộ: ba kỹ sư dùng AI sinh ra một triệu dòng code trong năm tháng với trung bình 3,5 pull request/ngày mà không viết tay dòng nào. Mô hình GPT‑4 giữ nguyên; điểm khác biệt nằm ở việc xây dựng một harness chặt chẽ. Sự kiện này thúc đẩy Mitchell Hashimoto (sáng lập Terraform) đề xuất công thức Agent = Model + Harness và Martin Fowler hệ thống hóa khái niệm guides/sensors. Các hãng như Stripe và GitHub sau đó cũng chia sẻ về hệ thống harness của họ.
Một thống kê khác cho thấy 88 % dự án agent không lên được production và 27 % thất bại vì chất lượng dữ liệu, chứ không phải do mô hình. Harness engineering ra đời để lấp khoảng trống này – nó không chỉ là quy trình tự động mà còn là bộ khung kiểm soát nhằm đảm bảo tính đúng đắn và độ bền vững của hệ thống.
4. Tương hỗ giữa Ontology và Harness trong Vibe Coding
Hai khái niệm ontology và harness không tồn tại độc lập; chúng bổ sung cho nhau để biến vibe coding thành quy trình nghiêm túc. Atlan nhấn mạnh rằng mọi thành phần của harness – từ guides tới sensors – đều tiêu thụ ngữ cảnh, chúng không tự sinh ra ngữ cảnh. Nếu ngữ cảnh đó là raw context, harness sẽ vận hành dựa trên định nghĩa lỗi thời và dễ dẫn tới quyết định sai. Do vậy, ontology (governed context) chính là nhiên liệu để harness vận hành hiệu quả.
Một ví dụ thực tế: Snowflake và Moveworks ghi nhận rằng khi thêm lớp ontology, độ chính xác của agent trong truy vấn dữ liệu tăng từ 10–31 % lên 94–99 %. Điều này minh họa tác động của ngữ cảnh có cấu trúc đối với hoạt động của harness. Đồng thời, khi harness có cả hướng dẫn và cảm biến, nó có thể sử dụng ontology để kiểm tra các ràng buộc nghiệp vụ và yêu cầu agent chỉnh sửa khi phát hiện sai phạm. Đây chính là vòng lặp “superpower” được mô tả trong nhiều dự án agentic: Brainstorm → Plan (xây dựng ontology) → Implement → Review (qua harness).
5. Kết luận – Vai trò mới của lập trình viên
Vibe coding không đánh dấu sự kết thúc của lập trình mà thay đổi vai trò lập trình viên. Với sự xuất hiện của ontology và harness engineering, lập trình viên chuyển từ “người gõ code” sang kiến trúc sư hệ thống:
- Thiết kế ontology: xây dựng bản đồ tri thức phản ánh đúng nghiệp vụ để AI không hiểu sai. Cần phối hợp với các chuyên gia miền để xác định thực thể, quan hệ và quy tắc.
- Xây dựng harness: thiết kế guides và sensors, lựa chọn công cụ kiểm tra, tạo pipeline dữ liệu và đảm bảo việc thực thi an toàn. Đây là “vòng tay” giúp AI sáng tạo trong giới hạn cho phép.
- Giám sát và cải tiến: theo dõi hiệu suất của agent, cập nhật ontology khi nghiệp vụ thay đổi và tinh chỉnh harness để giảm lỗi.

Khi hai nền tảng này được thiết kế tốt, vibe coding trở thành một phương thức mạnh mẽ: AI có thể tự động hóa việc viết code phức tạp, còn con người đảm nhận nhiệm vụ xác lập sự thật và quy tắc. Điều này mở ra tương lai nơi chúng ta không còn bị bó buộc bởi cú pháp, nhưng vẫn duy trì chất lượng và tính an toàn của phần mềm.







0 Lời bình