體驗了一把MiniGPT-4，一言難盡

原創

2023-06-08 14:10

最近看到一個好玩的開源項目：MiniGPT-4。

看名字像GPT-4的小老弟，其實沒啥關係。

簡單說，它可以識別圖像，基於圖像你可以和它對話，它能生成圖片描述、網站、詩歌。

先看看官方給出的例子截圖。

給圖寫一段廣告詞

還能教做飯

根據圖配上一段故事

臥槽，AI長眼睛了！

除此之外，它還能找到圖中的笑點、生成詩歌……還有更牛的，可以根據一張設計草圖，生成站代碼

看的我是目瞪口呆……上一次這麼目瞪口呆，還是看GPT-4的演示。

估計看到這裏，你和我一樣都被驚到了，那接下來的內容，可以讓你壓壓驚了。

這麼強的工具，說什麼我也得試試啊。

首先我找了一張911撞大樓的圖片，試試MiniGPT-4的識圖和描述。

下面是我傳給它圖片，和我倆的問答。

嗯，它回答的看着還行，像模像樣的。

像模像樣也就到此爲止了，接下來MiniGPT-4的表現就有點讓我失望。

我找了一個宮保雞丁的圖片，讓它教我做飯。

MiniGPT-4看成了炸雞肉？！

蔥段、辣椒：我倆不配被識別？

我提示一下

經過提示，它倒是知道了是宮保雞丁了。但是做法沒改過來……還是芥末、香菜……

可能它不擅長中國菜吧，不難爲它了，換一道題，據說它能get圖像的笑點。

我用的這張圖

問它笑點在哪

沒有解釋笑點，只是單純的描述了圖，而且還描述錯了，把手機看成了電腦。

我換了問法，又進行了提示，結果還是不太行。

再換個題，來個簡單的。

哎，又逃避問題，沒回答電影名也就算了，圖的描述也有點胡說八道了，“白襯衣黑褲子”，“看起來很休閒”。

心累！每一次提問完等回答，都要等好幾分鐘，等了半天就等到了這麼不正經的回答。

當初看完官方例子之後，我心裏還竊喜，MiniGPT-4可以幫我一個大忙：每次發朋友圈，給圖配文字我都費勁想半天，到底文字怎麼寫才能顯得我有才華。

試了一下，結果你們自己看吧。

已經無力吐槽了……

不應該啊，是我的問題？用法不對？

那我用官方例子的圖片，試試圖片生成代碼。我就不信了。

還是老樣子，MiniGPT-4還是無視問題，悶頭自己描述……

又問了一次，代碼總算寫出來了。

但是，這代碼看起來也不對啊。

這時候，和官方截圖一對比，我有一種的感覺:
紅燒牛肉麪裏沒看到牛肉。

以上就是我的體驗過程。

因爲每次提問之後，等答案都要好久，再加上有點失望，有些想法就沒再嘗試了。

總的來說，這次體驗有點一言難盡：我帶着好奇心和不明覺厲玩了半天，結果感覺我被玩了。

但是，靜下來想想，MiniGPT-4這種交互形式還是挺讓人眼前一亮的，或許我的用法不對，或許它需要時間來不斷迭代進化，或許我們應該給它更多耐心。

就衝着它的團隊裏有好幾個華人名字，怎麼着也得支持一下。

希望它以後能速度更快，功能更強大，MiniGPT-4早日不Mini。

最後，附上它的幾個地址，感興趣的小夥伴可以去看看。

官網和演示：https://minigpt-4.github.io/

github：https://github.com/Vision-CAIR/MiniGPT-4

論文：https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf

我建了一個免費 ChatGPT 學習羣，在羣裏就可以免費使用 ChatGPT，入羣掃碼：

如果上面的羣二維碼過期了，你可以加我微信，我拉你入羣：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

從零開始學架構V2-架構設計流程-2

一、架構設計流程架構的設計的是爲了降低整體的複雜性，那麼架構設計的第一步就是熟悉業務，識別其中的核心訴求，僅考慮技術的話就是識別複雜度。 1.1 識別複雜度架構的複雜度主要來源於第一節中介紹的“高性能”“高可用”“可擴展”等幾個方面，實

2024-04-25 23:56:26

從零開始學架構V2-初識架構設計-1

一、架構設計的主要目的爲了解決軟件系統複雜度帶來的問題二、複雜性來源軟件的架構設計是一個非常複雜的過程；基於業務&技術現狀、公司成本、團隊規模、團隊技術能力、近三年業務發展規模預測、技術發展趨勢等條件篩選出合適的技術、編寫多種架構設計

2024-04-25 23:56:25

高德地圖爬蟲實踐：Java多線程併發處理策略

背景介紹高德地圖是一款基於互聯網和移動互聯網的地圖與導航應用，提供了包括地圖瀏覽、公交查詢、駕車導航、步行導航等在內的多種功能。其龐大的用戶羣體和豐富的地圖數據成爲了各行各業進行位置服務、地理信息分析等應用的首選。爬蟲實踐需求在

2024-04-25 23:26:44

京東廣告研發——效率爲王：廣告統一檢索平臺實踐

1、系統概述實踐證明，將互聯網流量變現的在線廣告是互聯網最成功的商業模式，而電商場景是在線廣告的核心場景。京東服務中國數億的用戶和大量的商家，商品池海量。平臺在兼顧用戶體驗、平臺、廣告主收益的前提推送商品具有挑戰性。京東廣告檢索平臺

2024-04-25 23:17:47

三十分鐘入門基礎Go（Java小子版）

前言 Go語言定義 Go（又稱 Golang）是 Google 的 Robert Griesemer，Rob Pike 及 Ken Thompson 開發的一種靜態、強類型、編譯型語言。Go 語言語法與 C 相近，但功能上有：內存安

2024-04-25 23:17:43

實踐探討Python如何進行異常處理與日誌記錄

本文分享自華爲雲社區《Python異常處理與日誌記錄構建穩健可靠的應用》，作者：檸檬味擁抱。異常處理和日誌記錄是編寫可靠且易於維護的軟件應用程序中至關重要的組成部分。Python提供了強大的異常處理機制和靈活的日誌記錄功能，使開發人員能夠

2024-04-25 22:33:43

HCDG天津站精彩回顧 | AI高效開發， ModelArts技術動手工作坊

4月20日， HCDG城市行·天津站——“極快至簡靈活部署”我想象中的AI高效開發ModelArts技術工作坊圓滿舉辦。活動特邀來自華爲雲DTSE、華爲云云享專家、以及天津軟件技術協會的夥伴企業專家們爲與會開發者帶來一場別開生面的技術交流

2024-04-25 22:33:41

意派Epub360丨518國際博物館日H5，每個都大有看頭！

在文旅融合的當下，博物館成爲了很多人旅遊清單中的優先“打卡地”，而博物館文創產品也廣受大衆喜愛，並屢屢掀起消費熱潮。 518國際博物館日即將來臨，什麼形式的H5更適合用來宣傳博物館及相應的文物、活動呢？來看看高手們都是怎麼做的吧~

2024-04-25 22:25:00

使用前端技術創建 QR 碼生成器 API

前言 QR碼（Quick Response Code）是一種二維碼，於1994年開發。它能快速存儲和識別數據，包含黑白方塊圖案，常用於掃描獲取信息。QR碼具有高容錯性和快速讀取的優點，廣泛應用於廣告、支付、物流等領域。通過掃描QR碼，用戶可

2024-04-25 22:23:53

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

客戶案例｜Zilliz Cloud 助力 AI 在線教育：智慧樹的創新之路

在信息技術飛速發展的今天，教育行業正經歷着一場深刻的變革。智慧樹，作爲全球領先的學分課程運營服務平臺，始終站在教育創新的前沿。爲了進一步提升教育質量和效率，智慧樹攜手 Zilliz Cloud，共同開啓了一場教育與技術的深度融合之旅。通過

2024-04-25 21:20:29

利用 Amazon EMR Serverless、Amazon Athena、Apache Dolphinscheduler 以及本地 TiDB 和 HDFS 在混合部署環境中構建無服務器數據倉庫

引言在數據驅動的世界中，企業正在尋求可靠且高性能的解決方案來管理其不斷增長的數據需求。本系列博客從一個重視數據安全和合規性的 B2C 金融科技客戶的角度來討論雲上雲下混合部署的情況下如何利用亞馬遜雲科技雲原生服務、開源社區產品以及第三方

2024-04-25 21:18:23

前端面試題 - 元素的innerText outerText innerHTML的區別？

前端面試題 - 元素的innerText outerText innerHTML的區別？ innerText和outerText取值都是對象起始和結束標籤內部的文本內容。但是在設置的時候，outerText會把該標籤也替換掉。 inner

2024-04-25 11:51:02

前端面試題 - 在HTML5中DOCTYPE的作用是什麼？標準與兼容模式（混雜模式）各有什麼區別？

前端面試題 - 在HTML5中DOCTYPE的作用是什麼？標準與兼容模式（混雜模式）各有什麼區別？ DOCTYPE（文檔類型聲明）是一種在HTML文檔中使用的標記，用於告訴瀏覽器使用哪個HTML版本解析文檔。它的作用是確保瀏覽器正確地渲染和

2024-04-25 11:51:01

大模型區域落地再加速！百度“文心中國行”西部首站落地成都錦江

4 月 24 日，“文心中國行”西部地區首站落地成都錦江。成都市錦江區白鷺灣新經濟總部功能區、錦江區投資促進局與百度飛槳攜手合作，打造成都人工智能的新產業、新模式、新業態。來自成都政產學研各界的領導、專家、企業嘉賓，共同探討如何降低 AI

2024-04-25 11:41:53

24小時熱門文章

最新文章

最新評論文章