用Gemini给2岁女儿做小游戏

1. 基本介绍

1.1 代码和试玩

github 工程:

目前浏览器即可访问(两个地址都行):

面向 ipad 尺寸设计(电脑浏览器或者 ipad 可能适配相对更好)

备注:由于是浏览器打开,可以隐藏工具栏(Safari 为例),体验更好

1.2 出发点

女儿最近1岁半,偶尔想让她玩玩 ipad 上的切水果之类的小游戏,发现有些问题:

  1. 操作对我简单,但对她不简单(女儿只擅长点击和滑动,且容易多指误触)
  2. app store 游戏广告很多,进广告或者进奇怪的界面很容易卡死(对女儿而言)
  3. 适合1-3岁小朋友的游戏并不多(图形化叙事,立即能上手,不需要逻辑推理)

最近正好 Gemini 3.0 出了,其UI和交互细节设计蛮不错的,并且能内嵌 banana pro 调用,就很方便。

只用想方案就能制作游戏。

初期两天就初步制作和打磨了10款低龄小游戏(虽然每款都很简单,但 Gemini 3 还是太强了)。

每款游戏设计得都非常简单,且没有难度压力,且无需理解文字就能玩。

2. 游戏展示

超简易慢速版小朋友版切水果(支持二次切割,切成4瓣),并且游音效和粒子模拟汁水飞溅。

戳气球,戳爆有音效,且有小彩片飞出(亲测1岁半女儿很喜欢这种简单的)

喂猫猫,拖动不同的食物给猫猫,猫猫有不同的表情和叫声(叫声是音效网站找的)

模拟喂蚂蚁。把食物拖给蚂蚁,有概率被蚂蚁吃掉,也可能蚂蚁一起把食物搬走。

戳泡泡(女儿现实中也很喜欢泡泡)

点动物发出叫声并且给动销反馈,每点几次会换动物

点击随机不同的身体、眼睛、鼻子、嘴组合生成怪物

上下滑动切换天气

随意滑动施展魔法

拖车车吸附着,沿路前进,有不同的地图颜色(想表现雪地、沙漠、草地),之后再优化下场景

海底喂鱼体验模拟,可以看各种不同的鱼(暂6种),可以点击投喂,鱼会去追着食物吃,吃到了给表情反馈。

3. 实践经验

3.1 环境工具

个人当前用的 google antigravity 作为 IDE ,ssh 到阿里云服务器,在服务器上进行开发和直接部署。

远程开发好处还是蛮多的:

  • 公司电脑、家里电脑、笔记本电脑等等 都只需要有 antigravity (以前是只要 vscode 更简单),就能进同一个环境和工程,无缝衔接,无需额外同步操作。
  • linux 环境开发,linux 环境部署,保持了环境一致性,但同时又享受了 windows 开发的便捷。

antigravity 是基于 VScode 进行修改的,所以 VScode 有的基础功能 antigravity 基本都有。

所以我还有个麻烦是 linux 云服务器在香港,但香港访问 codex 和 gemini 好像也不太稳定。

但是 VScode 已经支持 proxy 配置,非常方便且稳定。可以利用在日本/美国的一个0.5g的小服务器作为跳板,proxy VScode 相关请求。具体配置见(如果有类似需求):

antigravity 目前 gemini pro 好像就可以无限用(至少我这几天一直没到过上限,同样的强度可能是 2个 ChatGPT plus 的周限制),猜可能是 antigravity 推广期吧。

不过预期不限量的体验时间有限,抓紧尝试。

3.2 Gemini 账号

网上有很多教程白嫖1年学生账号的,可以试试。

我目前用的是自己的谷歌账号,用中国的信用卡进行的充值

  • 但需要让谷歌账号的归属地在日本/美国之类的地方,好像传说是只要去过,并在那用过 google map 就非常容易改归属
  • 只要归属在日本/美国/墨西哥 之类的国家,再修改一下谷歌的支付信息即可(找网站生成假身份填进去)
  • 最后就是信用卡支付了,可以直接用 visa 卡,visa 卡的属地就填你的 google 账号的归属地,亲测 google 目前不检查 visa 卡本身的国家(比 openai 和 claude 宽松)

这块网上既有的教程挺丰富的,不赘述了,以及更粗暴的方式就是淘宝一个账号。

3.3 并行开发

Antigravity 打开工程以后,可以进入 Agent Manager,里面可以创建多个会话(任务),每个会话可以并行独立执行任务。

整体上和 VScode 上 codex 插件体验一致,还是蛮方便的,开发体验像玩游戏一般,处于多重斯金纳箱中:

  • 想到新 idea 随时开一个新会话开搞,只要评估不冲突,无需等待上一个完成
  • 可以多个模块同时制作/优化/打磨,根本停不下来
  • 也可以有会话专门用于讨论方案/idea

3.4 对当前 Gemini 能力的感受

其实模型+agent本身个人暂时没感受到相比于 codex 明显优势,甚至代码严谨准确性暂时 codex 感觉修改还更高一点。

但 Gemini 3 当前有两个很牛的优势:

  1. 多工具调用能力。
  2. UI 和交互细节实现能力。

Gemini 3 能直接调用 banana ,自动结合工程和需求,写 banana 的 prompt 这点实在太方便了。

甚至如果用 Google AI Studio 网页版,还能支持 APP 自动接 gemini 大模型(不过当前好像接的老版本 gemini),以及自动接语音之类的外部组件。这种综合能力太方便了。相比之下用 codex 搞 demo ,各种 API 都得自己找,自己接,图片也得自己写 prompt (并不简单)。

以及 Gemini 3 实现的 UI 很棒,交互小细节非常丰富有趣,操作起来有多巴胺,我体验蛮惊艳的(可以体验下):

可以直接小游戏体验一下,甚至其中 Animal Tap 这个小游戏就是基于这种交互反馈体验专门做的游戏

4. 后续

最近还会持续打磨和添加新游戏。

有想交流、反馈、提idea、提bug 等等都欢迎交流。

发表评论