Marius Argatu

Marius Argatu · BlogLong-form technical writing on software testing, with a focus on AI and LLM evaluation.https://www.mariusargatu.com/Your Evals Are Checks, Not Testshttps://www.mariusargatu.com/blog/your-evals-are-checks-not-tests/https://www.mariusargatu.com/blog/your-evals-are-checks-not-tests/Air Canada's chatbot cost CAD $812 for an answer evals scored as faithful. Five classical testing patterns catch what your eval dashboard cannot.Thu, 11 Jun 2026 00:00:00 GMTllmevalsragtestingagentic