多模態的個性識別分析總結

前言

上週我閱讀了4篇關於多模態的個性分析論文，其實這些多麼他的個性論文和多模態的情感分析都是一個道理，都是通過多個模態來進行分類，這是我的4篇論文的閱讀筆記地址。

Automatic Extraction of Personality from Text Challenges and Opportunities
https://blog.csdn.net/qq874455953/article/details/106441504
Investigating Audio,Video,and Text Fusion Methods for End-to-End Automatic Personality
https://blog.csdn.net/qq874455953/article/details/106491738
Automated Screening of Job Candidate Based on Multimodal Video Processing
https://blog.csdn.net/qq874455953/article/details/106536797
Context-Dependent Sentiment Analysis in User-Generated Videos
https://blog.csdn.net/qq874455953/article/details/106521878

個性分析綜述地址：

總結

這4篇個性分析論文都是使用三個模態，他們的整個模型框架大致相似，如下：

對於三模態，視頻，語音，文本一般的處理步驟如下

對於video爲兩種做法

對於多模態的視頻和語音方面的特徵提取，這些方面我並不是很瞭解，到現在應該會有一些比較新的方法，所以我需要去找一些這些新的方法，找到他們的改進空間。
對於文本方向的特徵提取，應該可以使用一些最新的模型來提高結果，例如BERT，等，例如在Multimodal Categorization of Crisis Events in Social Media 裏面其實用到了BERT，上層加入Attention，提升結果，而圖像方面用一些經典的方法 DenseNet ResNet等等，應該可以提升效果

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.