抖音集团技术公益大赛:"灵瞳"团队夺冠,为视障群体带来先进的视觉辅助
1月13日,在北京大钟寺的一个报告厅里,由抖音集团产品经理、研发工程师以及清华大学、浙江大学等高校学生组成的12支队伍正在进行决赛。这场“AI助力视障群体”为主题的技术公益大赛,在5个多月前拉开了序幕。在三个多小时的比赛中,3号参赛队伍“灵瞳”团队以最高分脱颖而出,获得了最高奖项。
“灵瞳”团队设计的是一款“对话式视觉助手”,这是一款应用于手机和智能眼镜的APP。它能听取和理解用户发起的提问,同时点击按钮录制物品信息,根据问题提取有效信息并语音回答。这款APP在交互和视觉技术上的表现得到了评委和观众的一致赞赏。
据ITBEAR了解,除了连续探索模式,“灵瞳”还可以实现指尖探索,即用手触摸屏幕来告诉用户物品的相对位置。还有一种功能是对话定位,用户可以先告诉“灵瞳”想要什么样的物品,例如想要寻找一个红色的东西,用户可以拿着摄像头去寻找,一旦你想要的目标出现在屏幕中,“灵瞳”就会提示用户目标物品的位置,是在屏幕的左侧还是右侧。“灵瞳”还具有一些辅助能力,例如帮助找对袜子、线下买衣服等,可以提供辅助信息和判断功能。
“灵瞳”团队的成功,不仅为视障群体带来了先进的视觉辅助技术,也为公益事业和技术革新做出了贡献。未来,“灵瞳”团队将继续努力,为更多的视障人士带来帮助。
相关文章
- 分析马斯克恢复的 10 个被禁 Twitter 账号数据,每年可创造 1900 万美元广告收入
- 微软称新版必应(Bing)上线不到 48 小时,注册申请用户数量已经突破 100 万
- 剖析字节案例,火山引擎A/B测试DataTester如何“嵌入”技术研发流程
- 微软终结IE11:本月14日正式停止对旧浏览器的支持
- 百度新专利获取授权 或为“文心一言”专利
- 国际空间站俄罗斯舱段计划延寿至 2028 年
- 微信正式支持“小号”注册
- 爱奇艺回应一号三用被封:技术故障 不需要充值更贵会员解封
- 四川子柒文化传播公司工商变更:微念退出股东行列
- 俄罗斯科技巨头 Yandex 几乎所有产品的源代码被泄露,公司称是前员工所为
- 春节假期想省钱换手机一定要比价 荣耀70 Pro不同平台价差达780元
- 百度健康携手人民网 多举措助力新冠基层诊疗补短板
- 华为发布业界首款2000Mbps全光组网:实现2G带宽按需扩频加速
- 爱奇艺客服回应HDMI连接被禁:部分视频版权保护严格
- 微软发布 AI 声音生成工具 VALL-E,只需 3 秒音频即可模仿人说话
- 联想美国高管谈笔记本市场竞争:不相信所谓的“后 PC 时代”