標貝科技｜智能語音助手+全息形象，會是下一個趨勢嗎

現在，智能語音助手已經無處不在，手機、音箱、電視、汽車裏都能尋得他們的蹤跡。他們都有一些相似的點：能識別語音、說喚醒詞就能開始對話、可以完成人們的各種指令，除了內在技能以外，在外表上，他們目前也都沒有能直接交互的可視化形象。

在小編看來，打造一個能交互的可視化智能語音助手，或許是智能語音助手發展的下一步，也可能成爲各個致力於交互式人工智能公司體現差異化的地方。

和二次元老婆一起生活

7月31日，即時通訊巨頭Line推出了擁有全息形象的智能助手——全新版本的Gatebox，旨在爲用戶提供家人般的陪伴。

Gatebox的外觀接近小桌燈大小，玻璃外殼，利用全息投影技術在玻璃內呈現出一個名爲Hikari Azuma的二次元人物。

Gatebox這款產品看起來天生就是爲日本宅男設計的，用一個玻璃盒就可以把自己的二次元“老婆”養在家裏。

演示視頻也瀰漫着一股單身宅的氣息。

第一個畫面，“宅男”在公司加班，Hikari Azuma通過Line發去了消息，“你記得今天是什麼日子嗎？什麼時候回來？”

“宅男”說，“馬上回來！”

Hikari Azuma：“好棒！”，隨手打開了家裏的燈，等待主人回家。

“宅男”回家後，Hikari Azuma立馬甜蜜問候：“歡迎回來。”然後羞答答地說：“今天是我們住在一起三個月紀念日，你記得嗎？”

“宅男”立馬拿出了禮物，Hikari Azuma看到之後開心地鼓掌。

“宅男”準備好食物和酒，開始慶祝時，Hikari Azuma把家裏的燈光系統調節成了溫馨浪漫的風格。

最後，“宅男”和Hikari Azuma舉起酒杯，互相感謝對方的陪伴。

視頻最後的一句話寫着：Living with characters(和二次元老婆一起生活)。

恩，看完視頻，小編感受到，霓虹國在關愛宅男方面，真的是很有建樹了。

從視頻中男主人與Hikari Azuma的交互來看，Hikari Azuma具備文字對話、語音識別、視覺感知等多模態的智能。據外媒報道，舊版的Gatebox需要按實體鍵才能進行對話，新版Gatebox-100可以直接說喚醒詞。而視覺部分則是通過外設的攝像頭和傳感器實現。

很遺憾，目前小編還沒有一手體驗，無法獲知Hikari Azuma的對話能力究竟如何，是否能實現連續的對話能力。

Line的智能語音助手佈局

Line這家公司爲何要做Gatebox這樣的產品呢？

Line是韓國最大的網絡運營商Naver Corp的子公司，其用戶數已經超過2億。除了即時通訊外，Line還有支付、音樂、遊戲等垂直業務。如今，互聯網巨頭蘋果、Facebook、亞馬遜都在做智能語音助手，Line進軍這個行業也是順理成章。

去年3月，Line發佈了一款名Clova的智能語音助手，然後推出了多款智能音箱，有Clove Wave、Champ、Face還有Clove Friends。

而Gatebox最初是由日本公司Vinclus開發，2016年曾推出限量300臺，售價30萬日元。2017年，Line收購了該公司的多數股權。

現在，Line推出大衆市場版本的Gatebox-100，售價降低到15萬日元（約合人民幣9112元），不過拒說想要和“老婆”生活，每個月還需要交納1500日元的生活費，不然老婆就要打包走人了。原來虛擬的老婆也是要養的。

但是，令人驚訝的是，Gatebox-100現在並沒有搭載Line的人工智能助手Clova。Line表示不久之後，Gatebox就會與Clova集成，可以獲得Clova更多AI技能，包括與第三方服務的更深層次集成。

在小編看來，不知道是否是因爲將Clova與Gatebox集成需要很大的研發精力，而Line又不確定Gatebox這種小衆路線的產品是否能獲得足夠的市場。

智能語音助手如何可視化

除Line之外，小編髮現還有不少公司在探索智能語音助手可視化之路。

三星也在研發類似Gatebox的產品。今年4月，在SXSW 2018展會上，三星推出了一款新型智能音箱原型產品，名爲Aurora。三星Aurora智能音箱沒有麥克風、處理器，甚至任何其他智能的組件，而是採用了可放置兼容智能手機的底座，需要把手機放進去，才能使用。顯示屏能夠投影出一個全息式的動畫角色。

還有微軟。

7月26日，微軟小冰升級到第六代，她才終於有了3D形象，以前，只是一張看不太清楚長相的二維頭像。

在此之前，或許是技術不成熟，又或許是打擾不同的人會對智能助理的外觀有不同的要求，小冰一直沒有具體的形象。經過四年的發展，小冰從一個活躍在QQ和微信裏純粹的聊天機器人進化成爲能寫新聞、主持節目、寫詩、唱歌、講故事、識別圖像的多才藝智能助理。VR和AR等技術也日趨成熟，視覺的3D化是大勢所趨。至少有了3D的形象，小冰就可以靠顏值去主持更多的電視節目。

微軟HoloLens團隊也多次表示，MR是視覺，AI是大腦，AI與MR的融合是必然。例如以後微軟小冰、小娜都會有3D的形象，你帶上眼鏡就能直接看到3D的小冰、小娜。

小冰從一開始定位爲聊天機器人，就很注重對人類的陪伴，這一點與Gatebox的定位其實是一致的。對陪伴式機器人來說，擁有可視化的外形會是加分項。

我們也看到，在小冰擁有3D形象之前。已經有網友自己製作出了微軟小娜的全息互動裝置。

這名愛好者名叫Jarem Archer，2017年5月，他在網上放出了一段視頻，展示與全息Cortana之間的互動。整個裝置都是他自制的，用Unity 3D製作動畫效果，用Kinect實現動畫動作，然後還採用了面部跟蹤來讓Cortana一直面朝說話者。

小編也設想，除了Gatebox這樣一個專門全息展示裝置之外，我們也可以通過其他的技術手段使得現在搭載智能語音助手的硬件也能有3D的形象。例如，利用手機AR，手機裏的智能語音助理就可以有3D形象，在用戶需要的時候被召喚出來，手機的攝像頭也可以識別人的動作和表情，幫助智能語音助理獲得視覺的部分。智能音箱則獲取可以依賴投影技術，向外投射出智能助理的形象。

小編也瞭解到，目前還有其他的專注於交互式人工智能的公司在探索智能語音助理的可視化，放置在公共場景，例如咖啡廳、麥當勞等場所，作爲服務員幫助用戶點餐，陪伴用戶等餐。

那麼，爲什麼現在都還沒有成熟的方案呢？

目前，對話式人工智能技術在不斷成熟，Google Assistant已經能夠打電話給餐廳幫用戶預訂位置，而服務員甚至無法辨認出對方是機器人。微軟小冰也已經能夠與人類通電話，能瞭解對方的情緒狀態，還能安撫對方的低落情緒。但是，這都是在文字、語音對話的層次上面。

可以想象，如果智能語音助手有了可視化的、具體的形象，人們在與其交流時，會給出更高的心理預期，期待更自然、更多交互的對話。在純文字和語音時，如果智能語音助手聽不懂人類的語音、回覆很慢、回覆完全風馬牛不相及，似乎還能原諒。要是有了一個可視化的形象，這樣似乎只會顯得很傻。有着完美形象，但是卻時常無法與之進行正常的交流，會很氣人吧。

像Gatebox這樣走的是宅漫風格，能把全息“老婆”帶回家，就已經能滿足很多人，或許能彌補交互上的問題。除了Line這樣的方案以外，小編好奇，還會有什麼樣合適的場景呢？

標貝科技｜音領智能未來

標貝科技｜智能語音助手+全息形象，會是下一個趨勢嗎

Line的智能語音助手佈局

智能語音助手如何可視化

通過f-string編寫簡潔高效的Python格式化輸出代碼

工作中用到的腳本合集

微服務實踐Aspire項目發佈到遠程k8s集羣

[轉帖]20個常用的Linux工具命令

[轉帖]PostgreSQL從小白到高手教程 - 第46講：poc-tpch測試

24-5-18 X

無障礙人機交互時代已向我們走來，標貝科技推出語音合成評測系統

2018AI開發者大會：推進語音事業發展，標貝科技首次免費開放TTS數據庫

“聲音復刻”的黑科技，有它逃不開的靈魂拷問

標貝科技｜AI企業級應用榜單發佈，百度、訊飛、標貝科技等50家產品上榜

標貝科技｜智能語音助手+全息形象，會是下一個趨勢嗎

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結