體驗了一把MiniGPT-4,一言難盡

最近看到一個好玩的開源項目:MiniGPT-4。

看名字像GPT-4的小老弟,其實沒啥關係。

簡單說,它可以識別圖像,基於圖像你可以和它對話,它能生成圖片描述、網站、詩歌。

先看看官方給出的例子截圖。

給圖寫一段廣告詞

還能教做飯

根據圖配上一段故事

臥槽,AI長眼睛了!

除此之外,它還能找到圖中的笑點、生成詩歌……還有更牛的,可以根據一張設計草圖,生成站代碼

看的我是目瞪口呆……上一次這麼目瞪口呆,還是看GPT-4的演示。

估計看到這裏,你和我一樣都被驚到了,那接下來的內容,可以讓你壓壓驚了。

這麼強的工具,說什麼我也得試試啊。

首先我找了一張911撞大樓的圖片,試試MiniGPT-4的識圖和描述。

下面是我傳給它圖片,和我倆的問答。

嗯,它回答的看着還行,像模像樣的。

像模像樣也就到此爲止了,接下來MiniGPT-4的表現就有點讓我失望。

我找了一個宮保雞丁的圖片,讓它教我做飯。

 

MiniGPT-4看成了炸雞肉?!

蔥段、辣椒:我倆不配被識別?

我提示一下

經過提示,它倒是知道了是宮保雞丁了。但是做法沒改過來……還是芥末、香菜……

可能它不擅長中國菜吧,不難爲它了,換一道題,據說它能get圖像的笑點。

我用的這張圖

問它笑點在哪

沒有解釋笑點,只是單純的描述了圖,而且還描述錯了,把手機看成了電腦。

我換了問法,又進行了提示,結果還是不太行。

再換個題,來個簡單的。

哎,又逃避問題,沒回答電影名也就算了,圖的描述也有點胡說八道了,“白襯衣黑褲子”,“看起來很休閒”。

心累!每一次提問完等回答,都要等好幾分鐘,等了半天就等到了這麼不正經的回答。

當初看完官方例子之後,我心裏還竊喜,MiniGPT-4可以幫我一個大忙:每次發朋友圈,給圖配文字我都費勁想半天,到底文字怎麼寫才能顯得我有才華。

試了一下,結果你們自己看吧。

已經無力吐槽了……

不應該啊,是我的問題?用法不對?

那我用官方例子的圖片,試試圖片生成代碼。我就不信了。

還是老樣子,MiniGPT-4還是無視問題,悶頭自己描述……

又問了一次,代碼總算寫出來了。

但是,這代碼看起來也不對啊。

這時候,和官方截圖一對比,我有一種的感覺:
紅燒牛肉麪裏沒看到牛肉。

以上就是我的體驗過程。

因爲每次提問之後,等答案都要好久,再加上有點失望,有些想法就沒再嘗試了。

總的來說,這次體驗有點一言難盡:我帶着好奇心和不明覺厲玩了半天,結果感覺我被玩了。

但是,靜下來想想,MiniGPT-4這種交互形式還是挺讓人眼前一亮的,或許我的用法不對,或許它需要時間來不斷迭代進化,或許我們應該給它更多耐心。

就衝着它的團隊裏有好幾個華人名字,怎麼着也得支持一下。

希望它以後能速度更快,功能更強大,MiniGPT-4早日不Mini。

最後,附上它的幾個地址,感興趣的小夥伴可以去看看。

官網和演示:https://minigpt-4.github.io/

github:https://github.com/Vision-CAIR/MiniGPT-4

論文:https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf

 

我建了一個免費 ChatGPT 學習羣,在羣裏就可以免費使用 ChatGPT,入羣掃碼:

如果上面的羣二維碼過期了,你可以加我微信,我拉你入羣:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章