AI Delivery Playbook

Nguyên tắc duy nhất

Thứ rẻ nhất mà có thể chạy được → chứng minh → rồi mới chi thêm.

Chúng ta bán dịch vụ AI với giá thấp. Điều đó chỉ khả thi nếu phương pháp lặp lại được và không ai phải nghĩ lại từ đầu cho mỗi dự án. Model mạnh hơn, RAG, fine-tuning, thêm hạ tầng — mỗi thứ là một chi phí, phải biện minh bằng một con số trên bảng điểm eval, không phải bằng cảm tính.

Bảy giai đoạn

Từ "khách muốn gì" đến "đã chạy & được giám sát"

Khám phá & Khoanh vùng

Vấn đề trong một câu. 5–10 ví dụ vào/ra (đây sẽ là bộ eval). Cái gì nằm ngoài phạm vi.

Dữ liệu & Tri thức

Câu trả lời cần kiến thức gì, nó ổn định hay thay đổi liên tục, và nằm ở đâu?

Cách tiếp cận

Chỉ prompt, long-context, RAG, hay fine-tune? Theo cây quyết định, rẻ nhất trước.

Chọn Model

Bắt đầu ở bậc rẻ nhất. Chỉ leo lên khi eval bắt buộc. Dùng model mạnh hơn để chấm điểm.

Lát cắt mỏng

Phiên bản đầu-cuối nhỏ nhất cho một ví dụ thật — kèm rào chắn ngay từ ngày đầu.

Đánh giá (Eval)

Bộ chuẩn + LLM chấm điểm về độ đúng & độ bám nguồn. Eval chưa xanh thì chưa ra mắt.

Triển khai, Giám sát & Bàn giao

Bề mặt nhỏ nhất hữu ích, log mọi request, cảnh báo ngân sách, runbook, lịch eval lại. Người khác (không phải tác giả) bảo trì được.