研究方向

多模态媒体信息智能处理

技术

理论

应用

人工智能

（1）动作识别技术：提出基于特征融合和模型增强的动作识别方法，突破非受限场景下动作捕捉和识别的技术瓶颈，识别精度在国际公开数据集上达到业界领先。

（2）应用实践服务：开发面向新闻人士的语言辅助训练系统，与康复中心、调查学校、手语社区等机构合作，助力听障人士普通话、手语等场景无障碍交流。

智能传播

（1）多模态数据挖掘：基于社交媒体中丰富的文本、图像和视频，建模多模态数据融合驱动的事件时空分布与风险演化规律。

（2）多模态可视分析：提升理解复杂社会的交互分析方法，显著提升复杂信息的理解与传播效率。

（3）多模态叙事生成：聚焦文本、图像、音频与视频等多维内容的协同生成机制，探索大模型驱动下的跨模态叙事结构建构与传播效果优化。

人机交互

（1）围绕多模态媒体信息智能处理展开交互分析、可视表达与应用服务研究。

（2）后续根据最终正文版本补充完整方向说明。

代表性学术成果

中文代表作

论文标题

作者

接收刊物年份

链接：doi | demo | arXiv

论文标题

作者

接收刊物年份

链接：doi | demo | arXiv

英文代表作

论文标题

作者

接收刊物年份

链接：doi | demo | arXiv

论文标题

作者

接收刊物年份

链接：doi | demo | arXiv

论文标题

作者

接收刊物年份

链接：doi | demo | arXiv

全部出版列表

⌕

2026

论文标题

作者

接收刊物年份

链接：doi | demo | arXiv

论文标题

作者

接收刊物年份

链接：doi | demo | arXiv

论文标题

作者

接收刊物年份

链接：doi | demo | arXiv