从一个小功能的实现来看免费 Gemini 和 ChatGPT 的表现
前几天有个 a4 pdf 的 iOS 限免,正巧作为小学生的小朋友有把长截图转成 pdf 然后打印的这个需求,下载后发现那个 app 就是接近于垃圾,不光把长截图放在一页 pdf 上,并不能切割成多页,而且因为人为缩小,清晰的图片成了毛玻璃。 今天周末小朋友来我这里玩,我于是建议小朋友自己通过 ai 来实现这个功能。 小朋友自己的 iPhone 上有梯子且熟练使用,寒假也注册并登录了 Gemini 、ChatGPT 等,听我建议不错,于是没有我任何指导,完全不懂编程的小朋友自个儿开干。 首先打开的 Gemini ,用 fast 模式,小朋友记录下 iPhone 相册里其中一张长截图的宽✖️长的数值,和 ai 说自己 iPhone 上有这么个宽长的图片,希望能根据自己输入的宽长,分割成几张图片,并且把图片转成 pdf 好打印。 Gemini 建议 html5j+js 方案,并且吧啦吧啦生成了源码,还贴心地告诉小朋友怎么拷贝源码保存在 iPhone“文件“app 中,最后浏览器打开并通过共享变成 iPhone 主屏的一个应用。 gemini 一气呵成的果然能一次运行并达到了小朋友的需求,接下来小朋友添加了一些需求和修改意见,也基本正常实现。 然后,小朋友把 Gemini 生成的源码打开 ChatGPT 并输入让 ai 检查代码是不是完全正确,如果正确请在代码后添加解说()注释。 ChatGPT 表示程序很不错,但是它能提高好几倍的效率,还有其它优化,牛吹得小朋友期望很高,然后四五个回合,正确的代码不能正确运行,而且已有的功能和界面也被 ChatGPT 缺失或者错位,不得已小朋友请我帮忙,才总算在免费额度用完之前 ChatGPT 出来了一个正常运行的版本。 仅就这个经历的个人感觉,同样免费版的 Gemini 看起来要比 ChatGPT 强大且准确度高。另外也感叹,完全没有编程基础的个位数小孩,也能凭自己的聊天,得到完美符合自己需求的小工具了,大把普通的 iOS (安卓) app 估计越来越没多少生存空间了。 btw ,总结下小朋友自己迭代聊天后满足的需求: 1️⃣从 iPhone 的“文件”、相册、拍照三种方式导入图片 2️⃣导入后,界面显示照片的如分辨率、拍摄时间等某些拍摄信息(小朋友不知道 exif 这个词) 3️⃣界面给出宽、长数值的手工输入,同时旁边有长宽比锁定下拉框(不锁定、2:3 、3:2……A4 幅面),根据长宽比选项,输入一个数值,另一个联动 4️⃣界面给出自定义图片名称,旁边有下拉框供选择分割后的几种图片格式,分割后图片名为自定义图片名称➕序号 5️⃣点“处理”按钮后,出现一个按钮为“图片压缩成一个文件”( Gemini 建议做的),另一个按钮是“转成 PDF”,旁边下拉框可以选择每页一张,每页两张,每页 2✖️2 四张,每页六张。 这两种方式都可以把 zip 和 pdf 保存到“文件”app 里。 6️⃣界面在点了“处理”按钮后,还同时会显示所有分割后形成的图片文件,图片下面显示带序号的文件名,Gemini 教小朋友长按具体图片来保存单张图片到“相册”
顺便补充一个细节:为了节省小朋友时间,我写了一个几行指令的“快捷指令”,用于迅速方便地打开(运行)“文件”app 里的.html 文件。