Project / Feb 16, 2026
Internal Codes 内部代码
一个实时多人画图猜词游戏,用视觉模型判断画作并用 LLM 校验玩家答案
- Role
- Solo project: idea, code, UI, iteration
- Stack / Topics
- WebGameLLMVisionCloudflare

项目概述
Internal Codes 是一个实时多人画图猜词游戏。玩家创建或加入房间,在画布上根据词语作画,其他玩家猜答案。和传统你画我猜不同的是,系统里加入了 AI 裁判:它既可以用视觉模型从画作中猜词,也可以用文本模型判断玩家答案和目标答案是否是同一个物体或概念。


核心流程
- 玩家创建房间或加入已有房间。
- Worker 为回合生成绘画词库,包括答案、分类、别名和难度。
- 玩家在画布上绘制,前端把 strokes 同步到房间状态。
- 玩家提交猜测时,系统先做标准化文本匹配和别名匹配。
- 如果文本不完全匹配,调用 LLM 判断玩家答案和目标词是否语义等价。
- AI 猜画时,系统把 strokes 渲染为 PNG data URI,发送给视觉模型,返回 guess 和 confidence。
- 达到置信度阈值后,AI 裁判给出回合判断。
怎么做的
房间状态放在 Cloudflare Workers 和 Durable Objects 里,玩家、回合、画布笔迹都在这里同步。题库由 LLM 生成,除了答案本身,还会带上分类、别名和难度。
判断答案分两层:先做普通文本和别名匹配,不行再交给文本模型判断是不是同一个概念。AI 猜画时,系统把笔迹渲染成 PNG,再发给视觉模型。所有模型输出都用 JSON schema 兜住,少一点自由文本带来的不确定性。
技术栈
- React + Vite
- Cloudflare Workers
- Durable Objects
- D1
- Server-Sent Events
- OpenRouter vision/text models
- TypeScript + Zod
传统你画我猜需要有人当裁判。我想试试能不能把这件事交给 AI:视觉模型从笔迹里猜词,文本模型判断玩家答案和目标词是不是一回事。两边接上之后,一局游戏就可以不用人类裁判。