2020年6月29日上午,安徽省科学技术奖励大会在合肥召开,我系汪增福团队凭“面向多模态人机交互的图像计算理论与方法”成果荣获2019年安徽省自然科学二等奖,完成人是:汪增福, 於俊,刘羽。
多模态人机交互中的图像计算理论与方法是描述人类感知机器人时空状态、刻画智能机器人行为特征和状态演化的基础,是提升系统易用性、性价比和自然度的核心。该项目完成人经过长期深入研究,取得了具有国际影响力的创新性成果。包括:1、揭示了人类双目视觉系统的感知规律,发现了视觉系统在不同图像区域间的协调和合作机制,构建了多层次、多区域的立体图像匹配数学模型和视差估计框架体系,解决了非可控和多干扰环境下三维物体精确重建的难题。2、阐明了多模态输入(图像、文本和语音)下机器人面部动作对人类自然感知的影响机制,构建了生理特性与统计学习相结合的真实感人脸图像合成模型,引入了语言指导下三维人头的语音一致性发音可视化表达,设计了语言、语音和人脸发音运动的同步性联合估计理论框架,突破了传统虚拟机器人的表情生硬和说话自然度欠缺等限制,解决了图像、文本和语音多种输入实时驱动下人脸图像三维分析、识别和生成的难题。3、完善了多源信息融合框架下的图像增强和视频超分辨体系,构建了多聚焦图像、多曝光图像以及多传感器图像的完整融合表达。上述工作得到了国际同行高度认可。