Anthropic Bị Ném Đá: Claude Giảm Hiệu Suất Ẩn, Người Dùng Phẫn Nộ
Giới thiệu
Anthropic — công ty định giá $380 tỷ,Maker của Claude — đang hứng chịu làn sóng phẫn nộ chưa từng có từ cộng đồng developer. Không phải vì model ra mắt mới bị bug, mà vì model cũ BỊ GIẢM CHẤT LƯỢNG ÂM THẦM. Người dùng phát hiện Claude ngày càng hay bỏ dở task, lấy shortcut sai, hallucinate nhiều hơn — và khi tra hỏi, Anthropic mới thừa nhận: họ đã âm thầm giảm default "effort level" từ "high" xuống "medium" để tiết kiệm compute.
Bài viết này phân tích chi tiết vụ bê bối, nguyên nhân thực sự, và bài học cho bất kỳ ai đang phụ thuộc vào AI trong công việc.
Claude Đang "Dumb Down" — Và Có Chứng Cớ
Sự phẫn nộ bắt đầu từ cuối tháng 3/2026, khi nhiều developer dùng Claude Code phàn nàn trên GitHub, Reddit, và X (Twitter) rằng model ngày càng kém:
- Hay bỏ dở task giữa chừng — không hoàn thành các workflow phức tạp
- Lấy shortcut sai — chọn cách rút gọn thay vì cách đúng
- Hallucinate nhiều hơn — tạo ra thông tin không chính xác
- Không follow instruction — bỏ qua yêu cầu rõ ràng của user
Stella Laurenzo, Senior Director of AI tại AMD, đã công khai đăng bài trên GitHub với tiêu đề: "Claude cannot be trusted to perform complex engineering tasks". Bà phân tích 6.852 sessions và phát hiện: chiều dài suy nghĩ trung bình của Claude giảm từ 2.200 ký tự xuống 600 ký tự — giảm 73%.
Đây không phải "cảm nhận" — đây là data cứng từ một trong những công ty semiconductor lớn nhất thế giới.
Nguyên Nhân: Anthropic Âm Thầm Giảm "Effort Level"
Boris Cherny, trưởng nhóm Claude Code, mới thừa nhận vào ngày 13/4: Anthropic đã âm thầm chuyển default "effort level" từ "high" xuống "medium" trong đầu năm 2026.
Lý do đưa ra: "Sau khi internal benchmarks cho thấy default cũ quá dư thừa cho phần lớn workload." Nghe hợp lý — nếu bạn là Anthropic. Nhưng với người dùng đang trả tiền $20-200/tháng cho Pro và Max plans, đây là giảm chất lượng dịch vụ mà không thông báo.
Thực chất, đây là bài toán kinh tế: Claude càng "nghĩ nhiều" (high effort), càng tốn compute (token). Khi số user tăng vọt, compute cost cũng tăng tương ứng. Giảm effort xuống medium = tiết kiệm token = tăng biên lợi nhuận. Chỉ là — người dùng không được biết.
Đến ngày 7/4, Anthropic mới tăng lại effort lên "high" cho API users, Bedrock, Vertex, Foundry, Team và Enterprise. Nhưng đối với Pro và Max subscribers — những người trả nhiều tiền nhất — thay đổi vẫn chưa rõ ràng.
Phản Ứng Của Cộng Đồng: Từng Làn Sóng Phẫn Nộ
Làn sóng phẫn nộ lan nhanh trên nhiều nền tảng:
GitHub: Issue #42796 trên repo anthropics/claude-code thu hút hàng trăm comment, trong đó phân tích chi tiết của Stella Laurenzo (AMD) được xem hàng chục ngàn lần.
Reddit: r/ClaudeAI tạo "megathread" chuyên theo dõi quality degradation — với hàng trăm post phàn nàn.
X (Twitter): Nhiều developer high-profile chia sẻ trải nghiệm tương tự. Từ developers cancel Pro subscription cho đến teams enterprise chuyển sang competitor.
LinkedIn: Hàng loạt post từ AI professionals bày tỏ thất vọng. Có người cancel Claude Pro, có người gọi đây là "bait and switch" — thu hút user bằng chất lượng cao, rồi giảm chất lượng sau khi đã lock-in.
Vấn đề không chỉ là model kém đi. Vấn đề là sự thiếu minh bạch. Anthropic không thông báo thay đổi, không đưa ra option opt-out, và khi bị phát hiện thì chỉ nói " chúng tôi đang đánh giá lại".
Thiệu Minh Bạch = Thiếu Tin Cậy
Đây không phải lần đầu một AI company bị bắt quả tang "nerf" model. Nhưng vụ của Anthropic đáng chú ý vì 3 lý do:
Quy mô lớn: Claude Code là một trong những AI coding tool phổ biến nhất hiện nay, với revenue run rate reportedly đạt $2.5 tỷ. Hàng triệu developer phụ thuộc vào nó mỗi ngày.
Âm thầm thực hiện: Không có changelog, không có announcement, không có opt-out. User chỉ phát hiện khi model bắt đầu hành xử khác — và phải tự themselves trace lại nguyên nhân.
Định giá đang ở mức cao nhất: Anthropic vừa raise $30 tỷ ở valuation $380 tỷ. Việc giảm chất lượng dịch vụ ngay lúc Investors đang đánh giá cao nhất tạo ra rủi ro reputation nghiêm trọng.
Bài Học Cho Doanh Nghiệp Sử Dụng AI
Vụ bê bối này mang đến mấy bài học quan trọng cho bất kỳ doanh nghiệp nào đang dùng AI:
Không phụ thuộc vào một model duy nhất. Luôn có fallback plan. Nếu model chính giảm chất lượng, bạn cần sẵn model thay thế. Đặt câu hỏi: "Nếu Claude hôm nay giảm 30% hiệu suất, workflow của bạn có còn chạy không?"
Pin version và effort level. Khi dùng API, luôn set explicit effort level (high) thay vì dựa vào default. Pin model version (e.g., claude-opus-4-20250514) thay vì dùng alias (e.g., claude-opus-4) để tránh silent update.
Theo dõi performance tự động. Thiết lập regression test suite cho AI output. Nếu accuracy giảm, bạn phải biết ngay — không phải 3 tháng sau khi user phàn nàn.
Đòi hỏi transparency. Khi chọn vendor AI, ưu tiên company có changelog rõ ràng, model versioning công khai, và SLA cho output quality. Đừng chấp nhận "black box" cho product business-critical.
Kết luận
Anthropic đang ở giữa十字路口: bên cạnh là $380 tỷ valuation và IPO roadmap, bên kia là làn sóng phẫn nộ từ chính những user trung thành nhất. Việc âm thầm giảm effort level có thể tiết kiệm compute ngắn hạn, nhưng đang làm tổn thương thứ đắt giá nhất — trust.
Cho dù Anthropic restore high effort default hay không, damage đã xảy ra. Developer đã bắt đầu explore alternatives. AMD — một enterprise customer lớn — đã public criticize. Và message gửi đến thị trường rất rõ: model quality có thể bị thay đổi bất cứ lúc nào, mà bạn không được báo trước.
Nếu bạn đang dùng Claude (hoặc bất kỳ AI model nào) cho business-critical tasks, hãy đảm bảo bạn có contingency plan. Vì như vụ này cho thấy — "smart" model hôm nay có thể trở nên "dumb" ngày mai, và bạn có thể không được cho biết.
👉 Theo dõi OPA để cập nhật thêm phân tích về AI, LLM, và thị trường công nghệ.
Bài Viết Liên Quan
AI & Machine LearningClaude Nerf 73%: Khi AI Giảm Chất Lượng Âm Thầm Và Bạn Phải Tự Bảo Vệ Mình
6.852 sessions chứng minh Claude cắt 73% thinking length, retry tăng 80x, AMD giám đốc nói không tin tưởng. Phân tích vụ nerf và 5 bài học cho doanh nghiệp Việt Nam.
Generative AI Là Gì? Trí Tuệ Nhân Tạo Sáng Tạo Đang Thay Đổi Thế Giới
Generative AI đạt 100 triệu người dùng trong 2 tháng. Tìm hiểu cơ chế Transformer & Diffusion, so sánh GPT-4o vs Claude 4 vs Gemini 2.5, và ứng dụng thực tế cho doanh nghiệp Việt Nam.
AI Chatbot Cho Doanh Nghiệp: Tự Động Hóa Dịch Vụ Khách Hàng 24/7
AI chatbot LLM-powered xử lý 69% câu hỏi tự động 24/7. Tìm hiểu kiến trúc RAG, so sánh platforms và use cases thực tế cho doanh nghiệp Việt Nam.