Agentic AI

High-Level Design for a Conversational AI Evaluation Framework (Production Implementation)

Sep 23, 2024

A production-ready design for implementing a conversational AI evaluation framework—data models, scoring pipeline, slice dashboards, CI gates, and canary rollout.…

Piyush

Agentic AI Conversational AI AI Evaluation observability evaluation

High-Level Design for a Conversational AI Evaluation Framework (Production Implementation)

A Practical Framework for Evaluating Conversational Agentic AI Workflows

Sep 23, 2024

A production-ready framework to evaluate agentic conversational systems—task outcomes, conversation behaviors, and system reliability—plus datasets, judges, and a CI-friendly harness.…

Piyush

Conversational AI AI Evaluation Agentic AI evaluation observability

A Practical Framework for Evaluating Conversational Agentic AI Workflows

Building Your First LLM Application: a Production-Grade Path (Not a Toy)

Sep 22, 2024

A practitioner’s blueprint for building your first LLM app that’s actually production-ready—deterministic orchestration, typed tools, grounding, safety, observability, and evaluation.…

Piyush

beginner-ai-project llm-application Agentic AI orchestration

Understanding AI Agentic Workflows: A New Paradigm in Generative AI

Sep 22, 2024

A practitioner’s guide to building reliable agentic AI systems—planning, tools, memory, safety, and evaluation—plus a minimal blueprint you can ship now.…

Piyush

AI agents AI Agentic Workflows Agentic AI evaluation

Understanding AI Agentic Workflows: A New Paradigm in Generative AI

High-Level Design for a Conversational AI Evaluation Framework (Production Implementation)

A Practical Framework for Evaluating Conversational Agentic AI Workflows

Building Your First LLM Application: a Production-Grade Path (Not a Toy)

Understanding AI Agentic Workflows: A New Paradigm in Generative AI

Tags