1.FG-NET (2002)
下載:http://yanweifu.github.io/FG_NET_data/FGNET.zip
命名規則:078A11.JPG,078人物ID,A爲Age簡寫,11爲歲數。
FG-Net訓練集有818張圖片,測試集有170張圖片。此數據集包含了82個人在不同年齡的照片,同時提供了每張圖中68個人臉關鍵點信息。鑑於本數據集跨年齡的特色,FG-Net可用於年齡估計、跨年齡人臉識別、年齡變化推演(age progression)等方向的研究。FG-Net曾是年齡方面最流行的數據集之一【9】,但由於此數據集公佈時間較早(2002年)、人臉個數較少,且觀察其人臉均爲白種人,而且一些早期圖片爲黑白圖片,【9】指出該數據的準確率已趨近飽和。所以近期的論文很少用FG-net做Benchmark。
2. MORPH2 (2006)
下載:http://www.faceaginggroup.com/morph/
論文:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=1613043
根據論文引用情況,MORPH2數據集是目前最流行的年齡估計數據集之一,【2】【4】【5】等論文均在數據集基礎上進行了評測,但【9】指出該數據集的準確率近年也已趨近飽和。MORPH2也是一個跨時間的數據集,收錄了同一個人在不同年齡段的圖片。該數據集分爲商用和學術用版本,學術用版本包括了13000個人的55134張圖片,照片收集時間跨度2003-2007年,人物年齡爲16-77歲,平均年齡爲33歲。MORPH2數據集除年齡外還記錄了人物的其他信息,如性別、種族、是否戴眼鏡等。
3. Adience (2014)
下載:https://talhassner.github.io/home/projects/Adience/Adience-data.html
論文:https://www.openu.ac.il/home/hassner/Adience/EidingerEnbarHassner_tifs.pdf
Adience數據集包括2284個人的26580張圖片。其特點爲均爲真實場景下拍攝(in the wild),照片受到噪聲、姿態、光照等影響很大,旨在解決真實世界中的年齡和性別檢測問題,網站上同時提供了原始數據和矯正後的人臉。該數據集使用了區間標註的方法,分爲了8個區間:(0-2, 4-6, 8-13, 15-20, 25-32, 38-43, 48-53, 60-)。
4. CACD (2014)
下載:http://bcsiriuschen.github.io/CARC/
論文:http://cmlab.csie.ntu.edu.tw/~sirius42/papers/chen14eccv.pdf
CACD收集了2000個名人的163,446張圖片,年齡跨度爲16 到 62。截止論文發表時間,是當時最大規模的跨年齡數據集。收集照片的時間跨度爲2004-2013年。數據集同時也提供了16個人臉關鍵點的標註信息。CACD數據集提供者明確指出,雖然該數據集包含人物年齡信息,但只建議使用此數據集做跨年齡人物檢索,不建議使用該數據集來做年齡預估。、
5.ChaLearn LAP Dataset (2015 / 2016)
下載:http://gesture.chalearn.org/2016-looking-at-people-cvpr-challenge/isogd-and-congd-datasets
論文:http://www.cbsr.ia.ac.cn/users/jwan/papers/CVPRW2016_JunWan.pdf
LAP(Look At People)競賽於2015和2016舉辦了兩年,兩年數據集規模分別爲5000和8000(基於官網)。與其他數據集的標籤爲真實年齡不同,LAP數據集的標籤是外觀顯示年齡(apparent age),標籤制定平均了至少10個人的標註結果,所以每張圖片的年齡標籤都是一個正態分佈。比賽排名中使用的是結合均值和方差的綜合誤差E-error【3】。LAP數據集在20-40歲的分佈相對均勻,在0-15和65-100區間數據集較少。
6. IMDB-WIKI(2015)
下載:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
論文:https://www.vision.ee.ethz.ch/en/publications/papers/proceedings/eth_biwi_01229.pdf
IMDB-WIKI數據集是目前規模最大的年齡數據集之一,【3】的作者提出了本數據集並在其基礎上finetune網絡,贏得了LAP2015年的冠軍。本數據集來源包括IMDB(一個明星網站)和Wikipedia中的兩萬個人,圖片數量分別爲460723和 62328。標註方法是找到某個名人的照片,然後通過照片拍攝年份減其出生年份得到其年齡標籤。經過觀察和及【5】指出,由於數據集標註過程是自動處理的,故標註質量不高,有很多錯誤內容。在【3】、【5】中,主要使用該數據集進行網絡初始訓練。下圖是提取了幾張與筆者同生日名人的圖片,可以看到有些圖片甚至沒有人臉。
7. AFAD (2016)
下載:https://github.com/afad-dataset/tarball
論文:https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Niu_Ordinal_Regression_With_CVPR_2016_paper.pdf
數據集【4】規模爲164432張臉,其中63680張女性、100752男性。年齡段爲15-40歲。該數據集的特點是數據幾乎全是中國人。該數據的數據來源爲人人網,首先爬取人人網上的圖片數據並獲取相冊所有者的年齡,然後使用人力對錯誤圖片進行過濾。本數據年齡分佈也不是很均衡,在最年輕和年紀較大的年齡段數據較少(也好理解,因爲該年齡使用人人網的人少)。
根據觀察,感覺數據集整體標註效果比較準確,但有一些小圖片(22*22)看不清楚,且有很多同一個人的圖片幾乎完全一樣。數據集還有一個特點就是圖片截取的較小,只留了較少的臉部,髮型和頸部都去除了。其實年齡估計和人的髮型、身體等也有一定聯繫,截取太小將無法使用到這些信息。
8. MegaAge/MegaAge-Asian (2017)
下載:http://mmlab.ie.cuhk.edu.hk/projects/MegaAge/
論文:http://personal.ie.cuhk.edu.hk/~ccloy/files/bmvc_2017_megaage.pdf
MegaAge數據集由商湯發佈【2】,總數有41941張圖片,同一論文提出的MegaAge-Asian包含40000張亞洲人(絕大部分是東亞人)的圖片,兩個數據集年齡段都是0-70。數據集人臉的原始來源是MegaFace和YFCC。論文中提到,由於MegaAge-Asian的種族相對單一,故同一年齡估計算法MegaAge-Asian上的表現一般要優於MegaAge數據集上的表現。
經觀察,MegaAge-Asian標註結果比較精準,提供的圖片大小統一爲178*218,在保持比例前提下進行了補邊操作,數據集包含了明星和普通人的圖片。
9.AGE-DB(2017)
下載:https://ibug.doc.ic.ac.uk/resources/agedb/
論文:https://core.ac.uk/download/pdf/83949017.pdf
AgeDB包含16,488個各種名人的圖像,如演員,作家,科學家,政治家,每個圖像都註明了身份,年齡和性別屬性。 共存在568個不同的科目。 每個科目的平均圖像數爲29。最低和最高年齡分別爲1和101。每個科目的平均年齡範圍是50.3歲。博主還在論文作者那裏獲取了AGE-DB30的測試協議以及相關測試文件,有需要的同學可以留下你們的聯繫方式。
10.CAF(2018)
下載:騰訊未公開
論文:https://arxiv.org/pdf/1810.07599.pdf
CAF是騰訊收集的,其包括來自4,668個身份的大約313,986張臉部圖像。每個身份都有80面部圖像。所有這些圖像都經過仔細和手動註釋。考慮到缺乏確切的年齡信息,他們利用了公共預訓練年齡估計模型DEX [12]預測每個面部圖像的粗糙年齡標籤。
11.CAFR(2019)
下載:
論文:https://arxiv.org/pdf/1809.00338.pdf
CAFR總共有來自25,000的1,446,500張面部圖像 ,CAFR數據集中的主題。 每個人平均有57.86圖像。 應該是目前最大的跨年齡數據庫。論文還未被接受。
參考文獻
- Age progression in Human Faces A Survey
- Quantifying Facial Age by Posterior of Age Comparisons
- DEX: Deep EXpectation of apparent age from a single image
- Ordinal Regression with Multiple Output CNN for Age Estimation
- SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation
- Age and Gender Classification using Convolutional Neural Networks
- Face detection without bells and whistles
- Ordinal Hyperplanes Ranker with Cost Sensitivities for Age Estimation
- Age and Gender Estimation of Unfiltered Faces
- Active appearance models
- DeepCD: Learning Deep Complementary Descriptors for Patch Representations
- Deep expectation of apparent age from a single image