GoForum › 用户主页
licsber
加入时间: 2026-06-06 (19天前)
当前积分: 100
Lv0
回复了帖子 看到英伟达发布 LocateAnything 后,我用 5 天搞了个全自动 YOLO 标注工具
· 19天前
Cool 最近也在搞同样的事情 不过其实 SAM3 就是 Concept Segmentation 类型的模型了 看了你的代码 VLM 基本是用于 crop 的?鸟瞰全图 然后根据 prompt 做 bbox 丢给 SAM 做 mask 其实可以加一个精修和反馈的步骤 很多时候中文语料不能精准的…
codex 有的 claude 没订阅不知道 https://chatgpt.com/backend-api/wham/usage 获取还是挺简单的 可以像我一样写个简易小工具放桌面:
https://i.v2ex.co/u2wt7Pi7.png