未动科技(Untouch)郭子鱼:未来汽车的交互体验和技术趋向
未动科技(Untouch )副总裁兼合伙人 郭子鱼
郭子鱼:大家好,首先非常荣幸能够借这个机会在这里跟各位行业同仁、专家进行交流。在介绍主题之前,简单介绍一下我们公司。我公司(未动科技Untouch)一直致力于计算机视觉智能交互技术的创新与场景落地,让视觉AI赋能垂直行业,创造价值;团队成员主要是来自于微软亚洲研究院、中国科学院、北大、清华等国际大型研究机构的科学家和技术专家。公司成立三年以来,在人工智能领域一直深根细作,对于同行来说有点“低调和神秘”。但我们低调务实的团队,在这段时间,不断进行技术创新,结合场景需求不断完善产品方案,一直在打磨技术与产品场景。接下来我将介绍一下,我们为智能汽车座舱开发的智能视觉交互方案。
在人工智能、自动驾驶的浪潮下,未来汽车座舱内的交互体验将更加人性化。我们(未动科技Untouch)基于原创的顶尖的3D手势识别与3D人脸识别技术,实现车内智能座舱的非接触式手势控制、身份认证与驾驶员状态监控,提供一种安全、愉悦的车载人车交互新体验。下面我将从手势交互与人脸交互的角度,为大家介绍视觉智能交互技术带给汽车座舱的交互变革。
我们的3D手势识别技术,通过视觉传感器隔空识别手部的所有关节点和3D手势动作,从而实现非接触式手势控制。这一交互方式的最大优点是,不需要触摸或触碰,自然直观、学习成本低;目前,一些高端车型已经在量产车中使用。手势交互的普及,伴随的是物理按键的消失,使得车的内饰设计更加简洁美观。车内隔空手势控制另一大好处是,就是当我们的驾驶员正在开车的时候,提高了安全度,不用到处找按键,当你需要打开天窗的时候,左手握方向盘,右手一个动作,天窗可以开和关,整个过程,您的眼睛保持平视前方,观察路人、红绿灯和交通状况,大大提高了安全度和操控愉悦度。
通过手势交互可以实现车舱内各种常用的功能控制,比如:通过手势启动车载信息娱乐系统,然后利用切换手势,将应用切换为地图,手再动一下可以切换到大众点评的餐饮和加油站信息,操作自然直观。当我需要听喜欢的音乐,利用切换手势打开音乐歌单界面,手势隔空单击打开歌曲,只需要手简单一挥,就可以随心切换歌曲。另外,可以用顺时针转圈手势,把音量调大,我用逆时针手势把音量调小,这个转圈动作同时可以调空调冷热温度、风量大小等等。
手势非接触式隔空交互,带给用户全新的人车界面交互体验。试想,当你一个人驾车的时候,不想说话,或者觉得一个人自言自语挺傻冒,或者车内环境嘈杂导致语音识别不准确,那你做一个手势,车辆就能迅速识别和启动你想要的功能。体验是不是很自然愉悦?!
刚才我表述的手势交互应用方式只是冰山一角,没有铺开。大家可以展现自己的想像,比如我们切换地图时,需要放大看特写,在一个交叉路口我应该走左边还是右边,我的手指就可以指示地图扩大,呈现一个特写在屏幕上。当我拇指跟食指并拢,它又恢复到了全景。相当于把手机上百度地图、高德地图的常用操作,通过手势隔空交互,延伸到车载信息系统。
呈现在大家面前的这张PPT,就是刚才我描述的这几个常用性手势动作。我们还可以根据汽车厂家、集成商提出的各种特殊需求,量身打造出适合其车型的定制化的完整手势交互系统。
现在介绍一下驾驶员状态监控功能。它应用我们自主知识产权的顶尖的3D人脸识别技术,可以对人的脸部、情绪、瞳孔、眼睑等任何一个细节的差别进行检测,目的是实现驾驶员状态例如疲劳、分心的监控,实时评估驾驶员是否可以胜任驾驶,如果检测评估发现,驾驶员注意力不集中、疲劳、分心,我们的人脸识别监控系统可以给与驾驶员警告或提醒或紧急措施,避免因为疲劳、分心等原因造成的车祸惨剧,细心呵护你和你家人的出行安全!当然,我们的系统也可以与自动驾驶系统连接,
目前业内主流的还是以2D人脸识别为主,我们(未动科技Untouch)采用3D人脸识别技术,脸部疲劳分析的准确度与效果远超2D识别的效果。另外,3D人脸识别的优势是获得脸部全部三维信息,活体检测,防欺骗性高;正侧脸或遮挡下识别率高,这个优点让车主身份认证成为可能。
比如:通过人脸识别技术,可以实现汽车真正的无钥匙进入,车辆可以自己区分驾驶者和乘客,确保您的用车安全;识别出你的身份后,人工智能将自动设置你的喜好,例如座椅斜度、空调温度等,当然,还有你喜好的音乐推荐。将我们的智能视觉交互技术与其他人工智能技术相结合,可以满足用户多样化的需求,比如人工智能知晓了用户喜欢就餐的地点、食物喜好,到达餐馆前提前下订单等一系列服务。我们可以想象,这种状态下,车主的身份认证就是汽车互联网的入口。
以上所讲,就是我们(未动科技Untouch)基于3D手势识别与3D人脸识别技术,实现车内智能座舱的非接触式手势控制、身份认证与驾驶员状态监控功能。我们的技术框架大概如下,我们为客户提供基于手势识别与人脸识别的软件接口,满足客户在汽车应用程序开发上的各种交互创新需求。我们也提供满足车规的、全天候全路况使用的识别摄像头,为客户提供软硬一体化解决方案。
最后向大家汇介绍一下,未动科技(Untouch)的产品技术平台有四个,我们结合行业的应用需求,开发完整的智能视觉交互方案与产品,包括3D手势识别产品——黎曼平台,3D人脸识别产品——欧拉平台,3D SLAM产品——笛卡尔平台,及3D场景重建产品——高斯平台。目前我们在汽车座舱交互中,使用了我们的手势识别技术与人脸识别技术。我们的智能视觉交互技术正在落地到未来更多将要上市的车型中,期待与在座各位,车厂、集成商和Tier1等行业同仁合作,一起促进汽车座舱的交互变革!
问答环节
提问:我看到你们的人脸识别精度有97%,这个精度非常高,我之前看过一家公司好像精度也就在95%左右?
郭子鱼:这两个不冲突,他们做的是2D人脸识别,我们做的是3D人脸识别,3D的优势是获得脸部全部三维信息,活体检测,防欺骗性高;正侧脸或遮挡下识别率高,所以,综合来看,我们3D人脸识别准确率与精度都会比2D人脸识别高。双方定位的客户群体也是不一样的。他们主要定位还是政府、金融、安防,简单的2D人脸识别是无法满足车舱全天候全路况使用的。我们将2D人脸识别厂商当作友好同行,不是竞争对手,正是大家的共同努力一起教育用户和带动市场。
提问:3D人脸识别跟苹果的iPhone X上的一样?我有个同事买了iPhone X,他自己就解锁不了。
郭子鱼:苹果IPHONE其实在5年前已经做人脸识别了,现在推出是因为软硬件技术与市场环境相对成熟了。虽然,手机人脸解锁会出现误差,但是正是iPhone X出现教育了市场,并让更多厂商和用户了解到了3D人脸识别的应用价值。任何技术都会经历推出、改进、适应、粘性几个过程,技术永远是前进的,未来都会越来越完善的,这是必经且健康的过程。
提问:您这个3D识别是双目、TOF、还是结构光?
郭子鱼:我们的3D识别是基于深度图的,所以我们可以支持所有产生深度图的传感器,不管是TOF、结构光还是双目3D传感原理,我们的识别算法不依赖与3D传感的成像原理。
提问:你们采用的分辨率是怎样的?
郭子鱼:我们目前常用的分辨率是QVGA与VGA。
未动科技(Untouch)简介
未动科技(Untouch):国际领先的深度视觉AI(人工智能)软硬件方案提供商。
主要产品:
基于原创+顶尖的深度视觉AI算法和深度传感器的“一站式深度视觉AI(人工智能)技术解决方案,如:3D手势识别、3D人脸识别、3D SLAM(运动追踪)、3D场景重构等。”
团队背景:
微软总部、微软亚洲研究院、中国科学院、Intel研发中心、华为研发中心、清华、北大等国际大型企业和研究机构的科学家和技术专家,90%的员工学历为计算机博士及数学博士等。多名员工曾获全国数奥奖,教育部新世纪优秀人才,在TIP/CVPR/ECCV等知名期刊发表论文近40篇,研究领域覆盖三维立体成像与处理、计算摄像学、计算机视觉与图像学等,获得国家发明专利11项,研究领域覆盖多目视觉(stereo vision),计算摄影学(computational photography)等,在CVPR/PAMI发表过多篇文章,曾研发多款芯片,在研发设计、验证测试及市场应用方面有超过二十年的成熟经验和强势的高科技技术实力。
编辑推荐
最新资讯
-
大众汽车南京工厂或面临出售
2024-12-19 13:29
-
端到端专题:DDPG 基础算法与方法论介绍
2024-12-19 11:42
-
多模态大模型最新论文介绍
2024-12-19 11:42
-
建科股份收购苏州赛宝
2024-12-19 09:57
-
端云协同创变,中科创达与火山引擎共塑AI智
2024-12-19 09:56