研究方向

多模态媒体信息智能处理

技术

理论

应用

人工智能

(1)动作识别技术:提出基于特征融合和模型增强的动作识别方法,突破非受限场景下动作捕捉和识别的技术瓶颈,识别精度在国际公开数据集上达到业界领先。

(2)应用实践服务:开发面向新闻人士的语言辅助训练系统,与康复中心、调查学校、手语社区等机构合作,助力听障人士普通话、手语等场景无障碍交流。

智能传播

(1)多模态数据挖掘:基于社交媒体中丰富的文本、图像和视频,建模多模态数据融合驱动的事件时空分布与风险演化规律。

(2)多模态可视分析:提升理解复杂社会的交互分析方法,显著提升复杂信息的理解与传播效率。

(3)多模态叙事生成:聚焦文本、图像、音频与视频等多维内容的协同生成机制,探索大模型驱动下的跨模态叙事结构建构与传播效果优化。

人机交互

(1)围绕多模态媒体信息智能处理展开交互分析、可视表达与应用服务研究。

(2)后续根据最终正文版本补充完整方向说明。

中文代表作

论文标题

作者

接收刊物 年份

链接:doi  |  demo  |  arXiv

论文标题

作者

接收刊物 年份

链接:doi  |  demo  |  arXiv

英文代表作

论文标题

作者

接收刊物 年份

链接:doi  |  demo  |  arXiv

论文标题

作者

接收刊物 年份

链接:doi  |  demo  |  arXiv

论文标题

作者

接收刊物 年份

链接:doi  |  demo  |  arXiv

全部出版列表

2026

论文标题

作者

接收刊物 年份

链接:doi  |  demo  |  arXiv

论文标题

作者

接收刊物 年份

链接:doi  |  demo  |  arXiv

论文标题

作者

接收刊物 年份

链接:doi  |  demo  |  arXiv