谷歌圖像識別API向所有開發者開放

1

搜索是我們很多人發現信息的主要渠道,但只能搜索文字顯然是不夠的,圖像和視頻肯定是搜索領域的下一個發展方向。當然,Google Photos 已經能夠部分實現這個功能了,但很顯然這還遠遠不夠。

不過 Google 在週三宣佈,他們提供了一個強大的圖像識別工具,名爲 Google Cloud Vision API。對於開發者們來說,這可能會是一個非常有用的工具,有了它,開發者們就可以讓自己的軟件、機器人知道圖像上的信息了。

功能強大的圖像檢測工具

Google 在博客裏公佈了有關這個工具的詳細情況。

首先,作爲一個機器學習領域的技術,這個工具搭載的是我們之前給大家介紹過的智能機器學習系統 TensorFlow,Google 在上個月剛剛將這個系統免費開放給開發者們。

其次,它的主要功能是去學習並識別圖片中的內容。

這個工具的運行原理並不複雜,它能夠迅速將圖片分到數千種大的類別當中去,比如:船、獅子、埃菲爾鐵塔等等;然後偵測臉部相關的情緒,並識別圖片上相關的文字。

在他們看來,Google Cloud Vision API 有以下幾個吸引人的特性:

檢測實體:Google Cloud Vision API 可以從數千種圖片分類中檢測出圖片中的實體。除此之外,更吸引人的是,你還可以根據你自己的圖片類別建立自己的元數據,這樣,你就不必受制於 Google 爲你設定的那數千個分類,而有了更符合你自己的圖片分類。

字符識別:Google Cloud Vision API 所帶的光學字符識別技術可以識別圖片上的文字內容。其中支持的語言有很多種。

安全檢測:Google Cloud Vision API 的安全檢測功能可以識別出圖片中不合適的內容,此功能搭載於 Google SafeSearch。它可以幫助用戶避開那些令人不適的內容。

面部檢測:Google Cloud Vision API 的面部識別技術可以檢測到圖片中的人像,也能具體識別出眼睛、嘴等具體的器官,而更重要的是,它還能檢測到包括開心、悲傷等在內的 8 中情緒。爲了保護用戶的隱私,Google 還承諾不會在任何的 Google 服務器中儲存有關面部的任何信息。

地標檢測:Google Cloud Vision API 的地標檢測功能可以識別出世界上著名的一些自然和人文建築與景觀,同時還會爲你標出該地點的經緯度。

Logo 檢測:Google Cloud Vision API 的 logo 監測功能可以檢測出圖片中著名品牌的 logo。

下面是一些範例:

2

Google 的一次突破

有了這個工具,機器識別圖片的能力會大大加強。之前,你不能讓計算機自動爲你篩選照片;但現在,只需輸入相應的「類別」,計算機就可以爲你挑選出相應的圖片。

而開發者們現在可以好好設計一下自己的軟件和機器人等設備了。在不久的將來,也許當我們走進家門的時候,家中的機器人可以根據你臉上的表情選擇它該說的問候語;而你在上網時也能夠更精確地搜尋到想要的圖片了。

當然,對 Google 來說,推出這個工具也很正常。在這個領域,亞馬遜和微軟都已經走了很遠了。很多朋友可能還記得微軟在之前推出的識別年齡和情緒的小工具,這些都出自於微軟專注於人工智能領域的牛津計劃。Google 當然也不能落後。在之前,Google 也推出過一些進行預測的 API 產品,但都功能有限,沒有涉及到圖像這方面,因此,這次的這個舉動對 Google 來說也是一次大的突破。

這個 API 目前在 Google 雲平臺上提供一些有限的預覽,不過在將來,Google 將會把這個功能添加進 Google 雲儲存中。這樣可以使它的使用範圍更廣。

這個服務價格目前還不清楚,有興趣的讀者們可以在此(https://services.google.com/fb/forms/visionapialpha/)提交註冊申請。

文章鏈接:http://www.fuliba.com/16895.html (轉載時請註明本文出處及文章鏈接)

------------------------------------------------------------------

谷歌今天還公佈了使用這一 API 的價格。開發者具體需要支付的費用與使用量密切相關。例如,標籤識別的價格爲每千張圖片 2 美元,而基本的光學字符識別的價格爲每千張圖片 0.6 美元。

  在測試期間,谷歌將對用戶作出限制,即每月最多識別 2000 萬張圖片。谷歌表示,在預覽期內,已有多家公司配置了這一 API。例如,Yik Yak 使用這一 API 去提取文字。

  通過 Vision API,谷歌將與微軟 Project Oxford等項目展開競爭。後者目前仍處於技術預覽版階段。Project Oxford 提供了用於計算機視覺、人臉識別,以及情緒分析的 API。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章