Researchagentsplanningweb automationbenchmarks

Agents Model Web Tasks As Planning Framework

|March 16, 2026|By LDS Team

7.6

Relevance Score

Agents Model Web Tasks As Planning Framework

A paper submitted to arXiv on March 13, 2026, by Rotem Dror and collaborators treats web automation tasks as sequential decision processes and maps modern agent architectures to classical planning paradigms. The authors introduce five trajectory-quality evaluation metrics and a dataset of 794 human-labeled WebArena trajectories, and compare Step-by-Step and Full-Plan-in-Advance agents, finding 38% human-aligned success for Step-by-Step and 89% element accuracy for Full-Plan.

Key Points

1Map agent architectures to planning paradigms: Step-by-Step→BFS, Tree Search→Best-First, Full-Plan→DFS
2Propose five trajectory-quality metrics and 794 human-labeled WebArena trajectories for principled evaluation
3Show Step-by-Step matches human trajectories (38% success) while Full-Plan achieves 89% element accuracy