跨年齡數據集

1.FG-NET (2002)

下載:http://yanweifu.github.io/FG_NET_data/FGNET.zip
命名規則:078A11.JPG,078人物ID,A爲Age簡寫,11爲歲數。
FG-Net訓練集有818張圖片,測試集有170張圖片。此數據集包含了82個人在不同年齡的照片,同時提供了每張圖中68個人臉關鍵點信息。鑑於本數據集跨年齡的特色,FG-Net可用於年齡估計、跨年齡人臉識別、年齡變化推演(age progression)等方向的研究。FG-Net曾是年齡方面最流行的數據集之一【9】,但由於此數據集公佈時間較早(2002年)、人臉個數較少,且觀察其人臉均爲白種人,而且一些早期圖片爲黑白圖片,【9】指出該數據的準確率已趨近飽和。所以近期的論文很少用FG-net做Benchmark。

2. MORPH2 (2006)

下載:http://www.faceaginggroup.com/morph/
論文:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=1613043
根據論文引用情況,MORPH2數據集是目前最流行的年齡估計數據集之一,【2】【4】【5】等論文均在數據集基礎上進行了評測,但【9】指出該數據集的準確率近年也已趨近飽和。MORPH2也是一個跨時間的數據集,收錄了同一個人在不同年齡段的圖片。該數據集分爲商用和學術用版本,學術用版本包括了13000個人的55134張圖片,照片收集時間跨度2003-2007年,人物年齡爲16-77歲,平均年齡爲33歲。MORPH2數據集除年齡外還記錄了人物的其他信息,如性別、種族、是否戴眼鏡等。

3. Adience (2014)

下載:https://talhassner.github.io/home/projects/Adience/Adience-data.html
論文:https://www.openu.ac.il/home/hassner/Adience/EidingerEnbarHassner_tifs.pdf
Adience數據集包括2284個人的26580張圖片。其特點爲均爲真實場景下拍攝(in the wild),照片受到噪聲、姿態、光照等影響很大,旨在解決真實世界中的年齡和性別檢測問題,網站上同時提供了原始數據和矯正後的人臉。該數據集使用了區間標註的方法,分爲了8個區間:(0-2, 4-6, 8-13, 15-20, 25-32, 38-43, 48-53, 60-)。

4. CACD (2014)

下載:http://bcsiriuschen.github.io/CARC/
論文:http://cmlab.csie.ntu.edu.tw/~sirius42/papers/chen14eccv.pdf
CACD收集了2000個名人的163,446張圖片,年齡跨度爲16 到 62。截止論文發表時間,是當時最大規模的跨年齡數據集。收集照片的時間跨度爲2004-2013年。數據集同時也提供了16個人臉關鍵點的標註信息。CACD數據集提供者明確指出,雖然該數據集包含人物年齡信息,但只建議使用此數據集做跨年齡人物檢索,不建議使用該數據集來做年齡預估。、

5.ChaLearn LAP Dataset (2015 / 2016)

下載:http://gesture.chalearn.org/2016-looking-at-people-cvpr-challenge/isogd-and-congd-datasets
論文:http://www.cbsr.ia.ac.cn/users/jwan/papers/CVPRW2016_JunWan.pdf
LAP(Look At People)競賽於2015和2016舉辦了兩年,兩年數據集規模分別爲5000和8000(基於官網)。與其他數據集的標籤爲真實年齡不同,LAP數據集的標籤是外觀顯示年齡(apparent age),標籤制定平均了至少10個人的標註結果,所以每張圖片的年齡標籤都是一個正態分佈。比賽排名中使用的是結合均值和方差的綜合誤差E-error【3】。LAP數據集在20-40歲的分佈相對均勻,在0-15和65-100區間數據集較少。

6. IMDB-WIKI(2015)

下載:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
論文:https://www.vision.ee.ethz.ch/en/publications/papers/proceedings/eth_biwi_01229.pdf
IMDB-WIKI數據集是目前規模最大的年齡數據集之一,【3】的作者提出了本數據集並在其基礎上finetune網絡,贏得了LAP2015年的冠軍。本數據集來源包括IMDB(一個明星網站)和Wikipedia中的兩萬個人,圖片數量分別爲460723和 62328。標註方法是找到某個名人的照片,然後通過照片拍攝年份減其出生年份得到其年齡標籤。經過觀察和及【5】指出,由於數據集標註過程是自動處理的,故標註質量不高,有很多錯誤內容。在【3】、【5】中,主要使用該數據集進行網絡初始訓練。下圖是提取了幾張與筆者同生日名人的圖片,可以看到有些圖片甚至沒有人臉。

7. AFAD (2016)

下載:https://github.com/afad-dataset/tarball
論文:https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Niu_Ordinal_Regression_With_CVPR_2016_paper.pdf
數據集【4】規模爲164432張臉,其中63680張女性、100752男性。年齡段爲15-40歲。該數據集的特點是數據幾乎全是中國人。該數據的數據來源爲人人網,首先爬取人人網上的圖片數據並獲取相冊所有者的年齡,然後使用人力對錯誤圖片進行過濾。本數據年齡分佈也不是很均衡,在最年輕和年紀較大的年齡段數據較少(也好理解,因爲該年齡使用人人網的人少)。
根據觀察,感覺數據集整體標註效果比較準確,但有一些小圖片(22*22)看不清楚,且有很多同一個人的圖片幾乎完全一樣。數據集還有一個特點就是圖片截取的較小,只留了較少的臉部,髮型和頸部都去除了。其實年齡估計和人的髮型、身體等也有一定聯繫,截取太小將無法使用到這些信息。

8. MegaAge/MegaAge-Asian (2017)

下載:http://mmlab.ie.cuhk.edu.hk/projects/MegaAge/
論文:http://personal.ie.cuhk.edu.hk/~ccloy/files/bmvc_2017_megaage.pdf
MegaAge數據集由商湯發佈【2】,總數有41941張圖片,同一論文提出的MegaAge-Asian包含40000張亞洲人(絕大部分是東亞人)的圖片,兩個數據集年齡段都是0-70。數據集人臉的原始來源是MegaFace和YFCC。論文中提到,由於MegaAge-Asian的種族相對單一,故同一年齡估計算法MegaAge-Asian上的表現一般要優於MegaAge數據集上的表現。
經觀察,MegaAge-Asian標註結果比較精準,提供的圖片大小統一爲178*218,在保持比例前提下進行了補邊操作,數據集包含了明星和普通人的圖片。

9.AGE-DB(2017)

下載:https://ibug.doc.ic.ac.uk/resources/agedb/
論文:https://core.ac.uk/download/pdf/83949017.pdf
AgeDB包含16,488個各種名人的圖像,如演員,作家,科學家,政治家,每個圖像都註明了身份,年齡和性別屬性。 共存在568個不同的科目。 每個科目的平均圖像數爲29。最低和最高年齡分別爲1和101。每個科目的平均年齡範圍是50.3歲。博主還在論文作者那裏獲取了AGE-DB30的測試協議以及相關測試文件,有需要的同學可以留下你們的聯繫方式。

10.CAF(2018)

下載:騰訊未公開
論文:https://arxiv.org/pdf/1810.07599.pdf
CAF是騰訊收集的,其包括來自4,668個身份的大約313,986張臉部圖像。每個身份都有80面部圖像。所有這些圖像都經過仔細和手動註釋。考慮到缺乏確切的年齡信息,他們利用了公共預訓練年齡估計模型DEX [12]預測每個面部圖像的粗糙年齡標籤。

11.CAFR(2019)

下載:
論文:https://arxiv.org/pdf/1809.00338.pdf
CAFR總共有來自25,000的1,446,500張面部圖像 ,CAFR數據集中的主題。 每個人平均有57.86圖像。 應該是目前最大的跨年齡數據庫。論文還未被接受。

參考文獻

  1. Age progression in Human Faces A Survey
  2. Quantifying Facial Age by Posterior of Age Comparisons
  3. DEX: Deep EXpectation of apparent age from a single image
  4. Ordinal Regression with Multiple Output CNN for Age Estimation
  5. SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation
  6. Age and Gender Classification using Convolutional Neural Networks
  7. Face detection without bells and whistles
  8. Ordinal Hyperplanes Ranker with Cost Sensitivities for Age Estimation
  9. Age and Gender Estimation of Unfiltered Faces
  10. Active appearance models
  11. DeepCD: Learning Deep Complementary Descriptors for Patch Representations
  12. Deep expectation of apparent age from a single image
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章