Pixel相機是怎麼做到自動補抓最不錯的自拍照

原創

2019-04-18 13:49

網絡大廠 AI研究團隊近日在最新的Pixel相機中，於無快門模式Photobooth新增親吻偵測功能，當用戶親吻自己的愛人時，相機會自動捕捉這一瞬間。網絡大廠過去是藉由Photobooth模式，讓用戶更簡單地成功自拍，不管是一個人、情侶或是團體照，都能夠自動捕捉到最好的畫面。網絡大廠表示，要拍出一張好的團體自拍照其實不太容易，爲了能夠降低自拍的困難，網絡大廠研究團隊將自動攝影技術帶到Pixel手機上，一旦用戶進入Photobooth模式並按下快門鍵，系統將會自動在相機穩定，且同時確保拍攝對象有好表情的時候拍攝。

在一系列的Pixel相機功能中，網絡大廠於Photobooth加入了Top Shot和肖像（Portrait ）模式，來讓用戶儘可能拍出最好的照片，有別於針對後置鏡頭專用硬件優化的肖像模式，Photobooth則是針對前置鏡頭進行優化，爲了建置Photobooth，網絡大廠必須克服3項挑戰：如何在團體中正確辨識好內容、如何計算按下快門捕捉最佳時刻的時間，以及如何製作視覺動畫幫助用戶瞭解Photobooth看見的畫面。首先，網絡大廠研究團隊建立了用來理解好內容的模型，Photobooth仰賴兩個不同的模型來捕捉好的畫面，一個是臉部表情模型，另一個則是檢測用戶何時親吻的模型，網絡大廠與攝影師合作，整理了5個應該觸發自動拍攝的關鍵表情：微笑、伸舌頭、親吻（或是都嘴）、鼓起臉頰和警喜的表情，接着，網絡大廠訓練神經網絡針對這些表情進行分類。

相機系統自動辨識表情的下一步，就是要控制快門，用戶使用Photobooth模式按下快門後，系統會根據上述的模型辨識結果，針對畫面內容給予基本的質量評估分數，第一階段會將不好的畫面過濾掉，像是閉眼睛、講話、動作模糊、偵測臉部表情失敗等，Photobooth會暫時分析表情的信心值，來偵測拍照對象在照片中的表現，第一階段若成功通過，每一幀會受到更細化的分析，來產生整體的評分結果。整體的畫面評分考慮因素包含臉部表情質量和親吻分數，由於親吻偵測模型是針對整個畫面來執行，偵測輸出的結果可直接用於全畫面的分數值，而臉部表情模型是針對個別被攝者表情輸出結果，Photobooth利用attention模型將偵測到的表情，透過迭代的方式計算出表情質量的代表值，以及每個臉的權重，網絡大廠指出，權重相當重要，舉例來說，權重能夠強調畫面的前方區域，模型接着會爲畫面的表現質量，計算出一個通用的分數。內容相關來源:sbf勝博網址 http://tpmanager.org.tw/
最後，模型計算出的影像質量分數，被用來觸發快門，爲了找出拍攝出最佳質量的瞬間，快門控制算法保留了觀察畫面的短緩衝區，若一個畫面的質量分數比緩衝區之後的分數高，系統纔會保存該張照片，而緩衝區的時間也足夠短暫，讓使用者認爲Photobooth是實時的回饋。由於自拍時使用者使用的是前置鏡頭，能夠與屏幕上呈現的畫面互動，網絡大廠也在Photobooth模式中加入了視覺的指引，當用戶要拍照時，屏幕上方會出現一個直方圖案，當照片質量增加時，該直方圖案的尺寸也會變大，藉由這樣可視化的方式，協助用戶理解機器學習算法看見和捕捉的畫面，該直方圖案的長度被分爲4段，一是無法辨識清楚的臉部，二是可辨識臉部但是使用者並沒有看向鏡頭，三則是有看鏡頭但是沒有出現上述5種關鍵表情，最後則是有看向鏡頭且出現關鍵表情，長條指示圖案會隨着照片質量變動，當到達高質量分數時，Photobooth就會拍下並保存照片。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Pixel相機是怎麼做到自動補抓最不錯的自拍照

微軟人工智能 Linker Networks將加速自動駕駛發展

跟Zenbo說再見？華碩親自澄清機器人部門無裁撤計畫

一張圖片！Photo Wake-Up可演算便能讓照片人物動起來

建築能源管理有新方案綠銅科技法表出AI智慧電錶

南韓開創AI訓練可自產深度學習數據集

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結