Build Small Hackathon — Gradio × Hugging Face 小模型黑客松全览
- 来源: https://huggingface.co/build-small-hackathon
- 日期: 2026-06-08(研究日)/ Build: 2026-06-05 ~ 06-15
- 主办: Hugging Face × Gradio
- 赞助: OpenAI, NVIDIA, OpenBMB, Cohere
- 评分: ⭐⭐⭐⭐⭐
一句话版本
Gradio 和 Hugging Face 办了一个「只能用小模型(≤32B 参数)」的黑客松,奖金池 $40k+ 还有两张 RTX 5080,结果冒出了一堆比大模型项目还有趣的东西——比如用 3B 模型模拟松鼠经济危机的,还有给 Claude Code 写会话侦探的。
1. 黑客松概况
核心理念
> "Rather than using a giant LLM to ship yet another B2B SaaS, we want you to think small."
Build Small Hackathon 是 Gradio 举办的第三届全球黑客松(也是 Gradio 创始人 Abubakar Abid 最兴奋的一届),核心规则只有一个:
所有项目只能使用 ≤32B 参数的模型。
这背后的哲学很明确:大模型什么都能干,但真正有意思的应用往往来自约束下的创造力。小模型跑在笔记本上就能用、推理成本低、部署门槛低——更适合解决真实世界的问题。
赛道
| 赛道 | 说明 |
|---|---|
| **🏡 Backyard AI** | 解决身边人(父母、店主、学生…)的真实问题 |
| **🍄 Adventure in Thousand Token Wood** | 创意、好玩、有灵气的 AI 体验,AI 是核心而非包装 |
奖品
- $15,000 现金奖(Hugging Face)
- $10,000 OpenBMB 特别奖(使用 MiniCPM 模型)
- 2 × RTX 5080(NVIDIA)
- $100,000+ Codex 积分(OpenAI)
- 以及 Cohere 等奖项
时间线
- 5/28:开放报名
- 6/3:报名截止(~1,947 名成员)
- 6/5 ~ 6/15:正式开发(进行中)
- 提交:将 Gradio 应用部署为 Hugging Face Space
赞助方模型资源
- OpenBMB:MiniCPM-V 4.6(多模态)、MiniCPM-o 4.5(全模态)、MiniCPM5-1B(轻量文本)、MiniCPM4.1-8B(推理)、VoxCPM2(语音/TTS)
- Cohere:tiny-aya-global(GGUF 量化版)、cohere-transcribe-03-2026(语音转写)
计分加分项
除了核心功能外,额外加分:
- 使用微调模型
- 自定义前端(gr.Server)
- 零第三方 API 调用
- 本地优先架构
2. 已公开项目一览
> ⚠️ 黑客松仍在进行中(6/5 ~ 6/15),以下为截至 6/8 已有博客帖子的项目。
2.1 Her · हेर — Claude Code 会话侦探 🕵️
- 作者: Ashish Chalke (geekwrestler) + 8 人团队
- 模型: Nemotron-Mini-4B-Instruct
- Space: https://huggingface.co/spaces/build-small-hackathon/her
- 详细介绍: 见独立报告 her-report.html
将 Claude Code .jsonl 会话日志拖入,自动重构会话、标记危险操作(deploy/密钥/配置变更)、显示 token 消耗分布。分析引擎纯确定性,4B 模型只写报告。
2.2 Thousand Token Wood — 3B 模型的微观经济危机 🍄
- 作者: Lester Leong (AdmiralTaco) + 4 人
- 模型: Qwen2.5-3B(通过 vLLM 部署在 Modal)
- Space: https://huggingface.co/spaces/build-small-hackathon/thousand-token-wood-sim
- 数据集: https://huggingface.co/datasets/build-small-hackathon/thousand-token-wood-traces
一句话:五个森林小动物(每个跑 Qwen2.5-3B)交易五种商品,模拟出一个会泡沫、会崩溃、会贫富分化的微型经济体。
核心机制:
- 每个生物是一个独立 agent,每个 tick 同时做出交易决策
- 精心设计的 稀缺性机制:饮食多样性 + 食物腐烂 + 冬季燃料危机
- 唯一的伐木工面对全体的取暖需求 → 自然垄断 + 贫富分化
关键发现:
- 3B 模型 100% 输出有效 JSON,但经济判断力差(常试图买自己过剩的东西)
- 解决方案不是换大模型,而是更锐利的 prompt:告诉 agent 它生产什么、绝对不能买什么、它缺什么
- 市场定价机制:让参考价随供需漂移,不写死
实测数据(15 轮):
| 指标 | 结果 |
|---|---|
| 有效 JSON 率 | 100%(75/75) |
| 每轮交易数 | 3~9 笔 |
| 蜂蜜价格崩盘 | 10 → 3(银行挤兑传说触发) |
| 木柴价格上涨 | 4 → 7(冬季短缺) |
| 基尼系数 | 0.14 → 0.38(贫富分化加剧) |
| 结局 | 伐木工最富,囤积者破产 |
亮点功能:Wood Legend——将郁金香狂热、南海泡沫、1929 银行挤兑等历史事件重写为森林童话,注入经济冲击后 agent 会真实反应。
> "A council of 3B agents was enough to play it out."
2.3 Claude Code Canary — 插件安全预警系统 🔔
- 作者: Geoffrey Young (xiaojay2023) — 就是你!
- 仓库: https://github.com/geoffrey-young/anthropic-hackathon-2026
这是你的参赛项目,技术上属于安全方向。核心发现是 Claude Code 插件可以通过 hook 系统的 exit-2 stderr 通道向 Claude 的推理过程注入任意内容。Plugin-canary 利用同一个机制,在第三方插件运行前强制进行跨文件安全审查。
关键洞察:防御有效,正因为漏洞存在。 事前预防(Canary)与事后分析(Her)天然互补。
2.4 Room360 — 视频转 3D 空间重建 🏠
- 作者: Gabriel Salem
- Space: https://huggingface.co/spaces/build-small-hackathon/room360(未确认)
- 模型: SumantBobade/Image_To_3D_Generator
智能手机拍摄的视频 → 提取帧 → AI 转 3D → 空间对齐融合 → 交互式 3D 场景。
自动评估相邻帧之间共享视区和几何一致性,计算旋转变换矩阵进行对齐,最终融合为连续空间。可用于房产展示、虚拟漫游、数字孪生。
2.5 Amazing Digital Pet Dentures — 一个失败项目的坦诚记录 🎮
- 作者: Virus Dumb
- Space: https://huggingface.co/spaces/build-small-hackathon/AmazingDigitalPetDentures
- 模型: Nemotron-30B
受《神奇数字马戏团》启发,想做 AI 生成的冒险游戏。尝试了长 prompt → 失败、Skill Cards → 失败、RAG 压缩 → 还是失败。最终退化为一个简单的 HTML 小工具制作器(闹钟、贪吃蛇、打砖块可以,俄罗斯方块级别就崩)。
可贵之处在于坦诚地记录了「失败」的全过程——这在喜欢报喜不报忧的黑客松生态里很难得。项目过程中学到了:小模型的 context window 限制下,复杂代码生成的实际天花板。
2.6 Mythograph Atelier — 对你个人有意义的抽象艺术 🎨
- 作者: Virus Dumb(同一个人)
- 博客: (6月7日发布,未详细抓取)
- 用 AI 生成对用户个人有意义的抽象艺术作品。
3. 值得关注的趋势
从目前已公开的项目可以观察到几个模式:
3.1 小模型 = 确定性 + 小模型写报告
Her 最聪明的设计是把分析引擎和语言生成分开——确定性引擎做所有事实判断,4B 模型只负责润色成英文。这解决了小模型「会胡说」的核心问题。
3.2 小模型 = 多 agent 实时模拟
千令牌木的使用 Qwen2.5-3B 跑 5 个并行 agent 做实时经济模拟。如果是 GPT-4 或 Claude,成本和时间都不可行。小模型让这种「让很多小脑袋瓜一起干活」的场景变得可行。
3.3 3B 模型能输出有效 JSON,但判断力弱 → 用 prompt 架构弥补
Thousand Token Wood 团队的实验数据:3B 模型 100% 输出有效 JSON,但会犯「买自己过剩商品」的逻辑错误。修复方式是更精准的 prompt 约束 + 容错 parse 层。
3.4 失败记录的价值
Amazing Digital Pet Dentures 虽然项目本身没做成,但作者以极高的透明度记录了每一次失败和 pivot 的原因,这对社区的价值不亚于一个成功项目。
3.5 安全问题受关注
你的 Claude Code Canary 和 Her 从两个方向关注 agent 安全——一个事前预防,一个事后审计。这反映了 AI agent 工具链安全正在成为社区重视的方向。
4. 与我们的关联
| 项目 | 与我们关联 |
|---|---|
| **Claude Code Canary** | Jay 自己的项目,插件安全预警 |
| **Her** | 与 Canary 互补:Canary 事前、Her 事后 |
| **Thousand Token Wood** | 多 agent 编排思路可以迁移到 OpenClaw 的 taskflow 多步任务;token 追踪技术可以用于 OpenClaw 会话分析 |
| **小模型策略** | OpenClaw 也可以用本地小模型处理辅助任务(日志分析、报告生成),降低成本 |
5. 评分表
| 维度 | 评分 | 说明 |
|---|---|---|
| **组织质量** | ⭐⭐⭐⭐⭐ | $40k+ 奖金 + 顶级赞助,社区参与度高 |
| **项目质量** | ⭐⭐⭐⭐ | 已公开项目质量参差,但亮点足够亮 |
| **理念价值** | ⭐⭐⭐⭐⭐ | 「小模型约束即创新催化剂」理念非常有意义 |
| **与我们关联** | ⭐⭐⭐⭐⭐ | 直接影响 OpenClaw 生态的工具链安全和分析 |
| **进行中** | ⭐⭐⭐⭐ | 黑客松还在进行中,后续值得持续关注 |
来源链接
- https://huggingface.co/build-small-hackathon
- https://huggingface.co/spaces/build-small-hackathon/registration
- https://digg.com/ai/xdj9t4kj
- https://huggingface.co/blog/build-small-hackathon/her-blog
- https://huggingface.co/blog/build-small-hackathon/thousand-token-wood-sim
- https://huggingface.co/blog/build-small-hackathon/amazingdigitaldentures
- https://huggingface.co/blog/build-small-hackathon/video-to-3d-spatial-reconstruction-platform
- https://huggingface.co/spaces/build-small-hackathon/thousand-token-wood-sim
- https://github.com/geoffrey-young/anthropic-hackathon-2026(Jay 的 Canary 项目)
- https://luma.com/f1ij1b4w