研究方向
多模态媒体信息智能处理
技术
理论
应用
人工智能
(1)动作识别技术:提出基于特征融合和模型增强的动作识别方法,突破非受限场景下动作捕捉和识别的技术瓶颈,识别精度在国际公开数据集上达到业界领先。
(2)应用实践服务:开发面向新闻人士的语言辅助训练系统,与康复中心、调查学校、手语社区等机构合作,助力听障人士普通话、手语等场景无障碍交流。
智能传播
(1)多模态数据挖掘:基于社交媒体中丰富的文本、图像和视频,建模多模态数据融合驱动的事件时空分布与风险演化规律。
(2)多模态可视分析:提升理解复杂社会的交互分析方法,显著提升复杂信息的理解与传播效率。
(3)多模态叙事生成:聚焦文本、图像、音频与视频等多维内容的协同生成机制,探索大模型驱动下的跨模态叙事结构建构与传播效果优化。
人机交互
(1)围绕多模态媒体信息智能处理展开交互分析、可视表达与应用服务研究。
(2)后续根据最终正文版本补充完整方向说明。
代表性学术成果
中文代表作
论文标题
作者
接收刊物 年份
链接:doi | demo | arXiv
论文标题
作者
接收刊物 年份
链接:doi | demo | arXiv
英文代表作
论文标题
作者
接收刊物 年份
链接:doi | demo | arXiv
论文标题
作者
接收刊物 年份
链接:doi | demo | arXiv
论文标题
作者
接收刊物 年份
链接:doi | demo | arXiv
全部出版列表
2026
论文标题
作者
接收刊物 年份
链接:doi | demo | arXiv
论文标题
作者
接收刊物 年份
链接:doi | demo | arXiv
论文标题
作者
接收刊物 年份
链接:doi | demo | arXiv