「寻找物品」- 一个无聊的小项目

一个月前我在整理东西的时候,发现收的时候很好收,但找就很难找。于是我写了一个可以接入多模态模型实现自动记录物品存取记录的程序。

这个程序仅需一台旧手机和一台可以运行 Python 的设备。其原理是通过内网将手机摄像头的画面传输到程序处理,程序向云端多模态模型发起请求,模型返回该物品的类别、位置和变化状态(“拿”或“放”)并存储在本地。

这个程序目前存在以下问题:

  1. 图像获取频率过低:默认是隔一秒拍一张,一个周期拍三张。过几秒再进入下一个周期。
  2. 模型性能导致的误判:受模型参数量、摄像头像素和拍摄角度等因素,在测试中经常会出现变化状态记录错误的情况(例如一个物品在一个记录周期内被连续“拿”了两次)。

因为上述问题的存在,导致这个程序并没有在当时开源。
我相信网络上肯定有项目比我这个程序拥有更完善的解决方案,所以请把这个项目看作是一次练习。

我想询问一下坛友的意见:这个项目应该开源并继续完善吗?

  • 来,让我看看!(开源)
  • 不要啦!(闭源)
0 投票人
1 个赞

cool

1 个赞

这个项目我再完善完善就端出来 :tm:

1 个赞