内容索引
浏览器渲染系统
解释 UI 表现
- Rendering pipeline
- DOM → CSSOM → Render Tree
- Layout / Paint / Composite
- Reflow vs Repaint
- GPU compositing
- Canvas / SVG / WebGL basics
- Layer tree / stacking context
- Performance bottlenecks
Browser APIs & DevTools
“控制 UI”
- Chrome DevTools Protocol (CDP)
- Playwright / Puppeteer
- Performance trace
- Network / Layout / Accessibility Tree APIs
Runtime & Sandbox
“隔离和控制 agent 行为”
- iframe sandbox
- CSP / SOP / CORS
- Shadow DOM
- Web Workers / Service Workers
- Node / Bun / Deno
- JS event loop
Research project
- 用 CDP 提取页面 layout tree
- 把 DOM 转成“UI graph”
参考资料
📚 书:
- 《Browser Internals》
- 《High Performance Browser Networking》
- 《You Don’t Know JS》(runtime 部分)
📖 博客:
- Chrome DevTools Blog
- Mozilla MDN (Rendering)
- Surma.dev(Google 工程师)
- Web.dev
自查问题清单
Level 1
- 浏览器如何从 HTML 到像素?
- Layout / Paint / Composite 区别?
- 重排 vs 重绘?
Level 2
- 为什么某些 UI 截图识别不稳定?
- 为什么模型无法判断 spacing?
- 如何从 DOM 推断视觉结构?
- 如何用 CDP 获取 layout 信息?
- playwright 自动化测试如何处理登陆和跨域问题?
Level 3
- 如何构建 UI 的结构化表示?
- 如何把 UI 转成 Agent 可理解的 state graph?
- 如何评估 UI 美学?
- 如何让 Agent 理解交互逻辑?