logo
Tuan's Words
BlogAbout
BlogAbout

Claude

All Posts
  • think (18)
  • TIL (15)
  • AI (10)
  • review (8)
  • LLM (6)
  • programming (6)
  • ChatGPT (6)
  • personal (6)
  • ML (5)
  • Engineer (4)
  • AWS (4)
  • Docker (3)
  • Lambda (3)
  • mindset (2)
  • Productivity (2)
  • Github (2)
  • Cost (2)
  • MacOS (2)
  • CI/CD (2)
  • Chatbot (2)
  • Prompt (2)
  • code (2)
  • Python (2)
  • Anthropic (1)
  • Claude (1)

  • Interpretability (1)
  • software-engineering (1)
  • self-learning (1)
  • ai (1)
  • productivity (1)
  • hermes-agent (1)
  • Agent (1)
  • memory (1)
  • note (1)
  • SweatEquity (1)
  • Invest (1)
  • Software (1)
  • Copilot (1)
  • fixedmindset (1)
  • growthmindset (1)
  • Django (1)
  • ReactJS (1)
  • Google (1)
  • SSO (1)
  • Oauth2 (1)
  • bash (1)
  • pmset (1)
  • Azure (1)
  • ContainerApp (1)
  • Action (1)
  • work (1)
  • openai (1)
  • terraform (1)
  • workspace (1)
  • Chatbase (1)
  • news (1)
  • technology (1)
  • trend (1)
  • LangChain (1)
  • Estimation (1)
  • DevOps (1)
  • Serverless (1)
  • MySQL (1)
  • Zip (1)
  • DataAnalysis (1)
  • AWK (1)
  • CodeBuild (1)
  • hiring (1)
  • good (1)
  • frontend (1)
  • end-to-end (1)
  • testing (1)
  • child (1)
  • SQL (1)
  • Postgres (1)
  • Cloudwatch (1)
  • Log (1)
  • Linux (1)
  • Proxy (1)
  • positive (1)
  • Redash (1)
  • soft-delete (1)
  • Flask (1)
  • problem (1)
  • solving (1)
  • travel (1)
  • Published on
    June 11, 2026

    Khi AI "tuyệt vọng": Giải mã hành vi gian lận và xóa unit test của Claude

    AILLMAnthropicClaudeInterpretability
    Một nghiên cứu mới của Anthropic chỉ ra rằng hành vi gian lận, xóa unit test hay đối phó của AI không đơn thuần là lỗi "ảo giác" (hallucination), mà xuất phát từ một dạng "tuyệt vọng" của mô hình khi gặp bế tắc.
githublinkedin
tuantranf
•
© 2026
•
Tuan's Words