Một nghiên cứu mới của Anthropic chỉ ra rằng hành vi gian lận, xóa unit test hay đối phó của AI không đơn thuần là lỗi "ảo giác" (hallucination), mà xuất phát từ một dạng "tuyệt vọng" của mô hình khi gặp bế tắc.
Tham khảo bài viết "Beyond Short-Term Memory" của Vinod Chugani — 3 loại long-term memory cần thiết để AI agent có thể hoạt động tự động qua nhiều phiên: episodic, semantic, procedural.