Continuous Human Action Recognition for Human-machine Interaction: A Review

  • 这篇综述1介绍了连续人类活动识别(HAR)的概念,方法,应用,和挑战。连续HAR是指利用传感器或视频数据来检测和识别人类的行为和动作,并且能够在输入视频中分割出不同的动作片段。连续HAR对于需要实时人机交互的应用非常重要,如智能家居,健康监测,安防监控等。然而,连续HAR也面临着一些挑战,如数据的多样性,复杂性,噪声,不平衡等。
  • 这篇综述回顾了近年来的相关文献,详细分析,解释,和比较了不同的动作分割方法,以及它们使用的特征提取和学习策略。这些方法主要分为两类:基于监督学习的方法和基于无监督学习的方法。基于监督学习的方法需要有标注的动作片段作为训练数据,通常使用深度神经网络,如卷积神经网络(CNN),循环神经网络(RNN),或者注意力机制来学习时空特征和动作边界。基于无监督学习的方法不需要有标注的动作片段,而是利用数据的内在结构,如变化点,子空间,或者聚类来发现动作边界。这篇综述还介绍了一些混合的方法,如半监督学习,弱监督学习,和自监督学习,它们试图利用有限的或者不完整的标注信息来提高动作分割的性能。
  • 这篇综述还讨论了物体检测和跟踪技术对于人类动作分割方法的影响,以及这些方法在真实场景中的应用和局限性。最后,这篇综述指出了一些未来的研究方向,如提高可解释性,泛化性,优化性,和部署性,以及探索多模态,多人,多视角,和多任务的连续HAR。

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Materia
图扩散模型在分子、蛋白质和材料科学中的生成式人工智能 - 知乎 (zhihu.com)