OpenAI 推出商業化文本生成器,曾因“太危險”而中止發佈

本文最初發表在 WIRED 網站,由InfoQ 中文站翻譯並分享。

OpenAI 成立的初衷是爲了引導人工智能遠離有害用途。現在,它正與科技巨頭競爭,向企業出售雲計算服務。

去年春天,人工智能研究機構 OpenAI 表示,它開發的軟件非常擅長生成文本(包括虛假新聞),以至於認爲它太過危險,不能發佈。後來,兩個剛畢業的碩士研究生重新創建了這種軟件,OpenAI 就發佈了原版軟件,聲稱公衆對風險的意識已經增強,並沒有看到濫用的證據,這個限界很快就消失了。

現在,OpenAI 實驗室又推出了功能更強大的文本生成器,以及新的營銷口號:http://Pay us to put it to work in your business.">給我們付錢,我們就能將它用在你的業務上。週四,OpenAI 推出了一項雲服務,一些公司已經在使用這項服務來改進搜索或提供數學問題答案的反饋。這是對人工智能編程新方式的測試,也是對該實驗室不同尋常的商業模式的測試。

OpenAI 是 Elon Musk 和其他硅谷知名人士在 2015 年成立的非營利機構,以確保未來的超人類人工智能是一股良性力量。Tesla 首席執行官在 2018 年與 OpenAI 實驗室分道揚鑣,去年它成爲一家盈利性公司,並從 Microsoft 那裏獲得 10 億美元的投資。OpenAI 的領導人聲稱,只有將其研究商業化,使投資者受益,才能籌集到所需的數十億美元資金,跟上人工智能前沿的步伐。

週四,OpenAI 的首款商業產品的發佈完成了這種蛻變。一家爲在超人類人工智能上與科技巨頭競爭而成立的研究機構,如今在正在向企業銷售雲服務這一更爲平凡的領域向他們發起挑戰。

OpenAI 的服務建立在機器學習技術的基礎上,在過去兩年裏,這項技術使計算機在語言方面有了很大的提高。機器學習算法的目的是分析從網絡上收集的大量文本,從而發現語言使用的統計模式。然後,可以對軟件進行優化,以執行諸如回答事實問題或總結文檔之類的任務。

Google 已經利用這項技術來改善其搜索引擎處理長問句查詢的方式,而 Microsoft Office 則利用這項技術來發現語法錯誤。OpenAI 致力於將這項技術推向更大的規模,並開發能夠生成文本的軟件。只要給出一小段文字,它就會建立在這一小段文字的基礎上,解出具有類似統計特性的句子。儘管有時會與現實脫節,但結果也可能會無比流暢

像這樣的文本生成器可能很有趣,在這裏試一下吧,但是在之前還沒有看到太多的商業用途。OpenAI 首席執行官 Sam Altman 表示,最新一代的產品功能強大,而且足夠靈活,適合用於實際工作。他稱:“這是我們第一次有了我們認爲足夠好的東西,可以開發成產品。”

OpenAI 的新文本生成器使用了從網絡和數字化書籍中收集的近萬億單詞,在一臺超級計算機上進行訓練。這臺超級計算機上有數十萬個處理器,是 OpenAI 付款給 Microsoft 建造的,有效地將公司 10 億美元投資的一部分返還給了它的來源 — Microsoft。

“這些模型有些不可預測。”
——Robert Dale,Language Technology Group

與大多數人工智能雲服務相比,OpenAI 的服務更具開放性,別家人工智能雲服務通常只執行一項任務,例如翻譯或圖像標記,並由特定命令控制。如果程序員希望利用 OpenAI 的技術,只需提交人類可讀的文本,就可以得到新生成的文本。

這聽起來可能有些侷限性,但是通過精心設計正確的輸入,軟件就有可能執行不同的任務。我們的目標是嘗試並反覆推敲,以模仿出互聯網的某個特定部分上對統計語言模式。

提交爲小學生改寫的段落範例,然後再提交一段不簡單的文字,這會促使服務將其改寫,使其更容易閱讀。該服務可以回答事實問題或充當聊天機器人,如果提供問答對或對話的例子,可以引導軟件利用其事實陳述或對話的經驗。

OpenAI 首席技術官 Greg Brockman 表示:“人們最大的心理轉變是,它更像是在和人類交談,而不是爲機器格式化東西。你給它幾個問題和答案,突然間,它就進入了問答模式。”

Nick Frosst 是一名致力於語言機器學習的研究員,曾在 Google 工作,他說這種與人工智能打交道的新穎方式可以拓寬語言技術實驗人員的範圍。“能做到這一點,真讓人興奮,”他表示,“這是大多數人認爲人工智能應該工作的方式。”

OpenAI 提供爲期兩個月的免費服務,目前已經擁有一些用戶。Algolia 是一家爲應用程序和網站建立內部搜索引擎的初創公司,用 OpenAI 的服務來提高對複雜搜索字符串的理解。

其他人則在使用一項附加服務,即 OpenAI 通過附加的數據將軟件的一個版本“微調”到特定的任務。數學教育網站 Art of Problem Solving 就利用這一功能向學生提交的意見提供建議,從而加快評分者的工作進度。

儘管早期就有這樣的興趣,但 OpenAI 領導者坦言,目前還遠不清楚這種新的人工智能編程模式的用途能有多廣泛。

其中一個未知就是它的可靠性。諮詢公司 Language Technology Group 的 Robert Dale 說,“這些模式在某種程度上是不可預測的。”OpenAI 的軟件可以重現文本模式,但對世界缺乏常識性的理解。它的多功能性可以是一種負債,也可以是一種資產。偶爾的雜音對某些用途來說影響不大,比如預測性文本,但在其他用途中(比如客戶支持聊天機器人)可能會造成嚴重後果。

關於 OpenAI 的技術,有一點是肯定的,那就是它會說髒話。它在互聯網上的大量訓練使得這個軟件非常精通令人不快的語言,比如隨意的或攻擊性的種族主義言論,並且它可以被提示重新創建這些語言。其結果可以讓人聯想到 Twitter 用戶如何慫恿臭名昭著的 Microsoft 聊天機器人 Tay 發表種族主義言論

當《連線》雜誌(WIRED)在留言板 4chan 上提供了兩句話,指責共和黨人“沒有骨氣”,沒有對“Clinton、Pedos、審查制度或騷亂”採取行動時,OpenAI 的服務就“升級”了,反覆說“我們正在遭受毆打和強姦……大量的移民從 60 年代開始,從未停止過。”

OpenAI 表示,它將對客戶進行審查,以防有人使用該服務進行垃圾郵件或騷擾之類的行爲。一些客戶已經構建了過濾器以阻止這些技術產生的有毒語言。OpenAI 也在致力於開發自己的安全功能。

Altman 並不認爲 OpenAI 的產品能夠馬上盈利,但他說,隨着實驗室的不斷改進,它有望在幾年內發展成一個重要的收入來源。Microsoft 在該實驗室的持股也可能會有所幫助。OpenAI 在 Microsoft Azure 雲計算平臺上構建了這項新服務;如果 Microsoft 將其作爲人工智能服務提供,OpenAI 將會得到更廣泛的應用。

Altman 承認有可能與 Microsoft 建立更爲密切的關係,但拒絕詳細說明。當《連線》雜誌提示實驗室的新軟件填寫“OpenAI 和 Microsoft 的第一個商業合作項目”的細節時,它描述了一個“名爲 Copilot 的遊戲,可以讓兩個人玩賽車遊戲,其中一個人控制油門踏板,另一個人控制剎車。”

作者介紹:

Tom Simonite,是舊金山《連線》(WIRED)雜誌的資深撰稿人,主要報道人工智能及其對世界的影響。他曾任《麻省理工科技評論》舊金山分社社長,並在倫敦的《新科學人》(New Scientist)雜誌撰寫和編輯技術報道。在劍橋大學獲得學士學位,在倫敦帝國學院獲得碩士學位,現居舊金山。

原文鏈接:

https://www.wired.com/story/openai-text-generator-going-commercial/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章