之前看到過很多頭條,說哪國某人堅持了多少年自學使用 excel 畫畫,效果十分驚豔。
對於他們的耐心我十分敬佩。
但是作爲一個程序員,自然也得挑戰一下自己。
這種需求,我們十分鐘就可以完成!
基本思路
實現這個需求的基本思路是讀取這張圖片每一個像素的色彩值,然後給 excel 裏的每一個單元格填充上顏色。所以主要用到的是PIL
、openpyxl
這兩個庫。
PIL 使用
PIL
是 Python 裏面做圖像處理的時候十分常用的一個庫,功能也是十分的強大,這裏只需要用到PIL
裏一小部分的功能。
from PIL import Image
img = Image.open(img_path) # 讀取圖片
width, height = img.size # 獲取圖片大小
r, g, b = img.getpixel((w - 1, h - 1)) # 獲取像素色彩值
Image.open()
是 PIL 裏面打開一張圖片的函數,支持多種圖片類型
img_path
是圖片路徑,可以是相對路徑,也可以是絕對路徑
img.size
是獲取圖片的size
屬性,包含圖片的寬和高
img.getpixel()
是獲取圖片色彩值的函數,需傳入一個tuple
或list
,值爲像素座標xy
openpyxl 使用
openpyxl
幾乎是 Python 裏功能最全的操作 excel 文件的庫了,這裏也只需要用到它的一小部分功能。
import openpyxl
from openpyxl.styles import fills
workbook = openpyxl.Workbook()
worksheet = workbook.active
cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)
workbook.save(out_file)
openpyxl.Workbook()
新建一個 excel 文件
workbook.active
激活一個工作表
cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)
填充一個單元格,fill_type="solid"
是填充類型,fgColor=hex_rgb
是填充的顏色
workbook.save()
保存文件,需傳入要保存的文件名
寫一段代碼
寫這一個畫圖的需求需要用到的核心就是上面介紹的PIL
跟openpyxl
的幾種用法。但是在實際寫的時候,還會有一些其他問題,比如:
-
getpixel()
獲取的顏色值是rgb十進制的,但
fills.PatternFill裏的
fgColor`參數接收到的顏色值是十六進制的值這個問題其實就是十進制轉十六進制,很容易解決
def int_to_16(num): num1 = hex(num).replace('0x', '') num2 = num1 if len(num1) > 1 else '0' + num1 # 位數只有一位的時候在前面補零 return num2
-
excel 的單元格默認是長方形,修改爲正方形纔不會使圖片變形
if h == 1: _w = cell.column _h = cell.col_idx # 調整列寬 worksheet.column_dimensions[_w].width = 1 # 調整行高 worksheet.row_dimensions[h].height = 6
這裏用到了雙重for循環,外層是`width`,裏層是`height`,是一列一列的填充顏色,因此判斷`if h == 1`,避免多次調整列寬。
-
excel 支持的樣式數量有限
這個問題比較嚴重。如果直接對高清大圖進行操作,最後輸出的 excel 文件在打開的時候,可能會提示我們文件有問題,需要自動修復。
但是等它修復完成之後,會發現填充的所有顏色都消失了!
一開始以爲是使用的行列數過多了原因。
查詢資料後發現,13 版 excel 支持的大行數是 1048576,最大列數是 16384,我們使用的單元格數量還遠沒達到限制。
在經過更換圖片、更換 excel 版本,修改代碼等不充分各種測試,才找到問題的原因所在。
原來是因爲,excel 的原形是由多個 xml 文件,填充的顏色都存儲在一個style.xml
文件裏面,當這個文件過大就會導致打開的時候報錯。
所以爲了解決這個問題,有兩個解決方案,第一是縮小圖片,第二是減少圖片顏色。縮小圖片的時候自帶減少圖片顏色的功能,減少圖片顏色的方法可以採用灰度化、二值化等方法。
總體上來講,就是需要控制顏色數量*單元格數<閾值(3300w左右)
。
MAX_WIDTH = 300
MAX_HEIGHT = 300
def resize(img):
w, h = img.size
if w > MAX_WIDTH:
h = MAX_WIDTH / w * h
w = MAX_WIDTH
if h > MAX_HEIGHT:
w = MAX_HEIGHT / h * w
h = MAX_HEIGHT
return img.resize((int(w), int(h)), Image.ANTIALIAS)
最終效果
蒼天不負有心人,打開最後輸出的 excel 已經可以看到效果了!
所以說,一切能用 Python 解決的問題,最終都會用 Python 來解決。
全部代碼
# draw_excel.py
from PIL import Image
import openpyxl
from openpyxl.styles import fills
import os
MAX_WIDTH = 300
MAX_HEIGHT = 300
def resize(img):
w, h = img.size
if w > MAX_WIDTH:
h = MAX_WIDTH / w * h
w = MAX_WIDTH
if h > MAX_HEIGHT:
w = MAX_HEIGHT / h * w
h = MAX_HEIGHT
return img.resize((int(w), int(h)), Image.ANTIALIAS)
def int_to_16(num):
num1 = hex(num).replace('0x', '')
num2 = num1 if len(num1) > 1 else '0' + num1
return num2
def draw_jpg(img_path):
img_pic = resize(Image.open(img_path))
img_name = os.path.basename(img_path)
out_file = './result/' + img_name.split('.')[0] + '.xlsx'
if os.path.exists(out_file):
os.remove(out_file)
workbook = openpyxl.Workbook()
worksheet = workbook.active
width, height = img_pic.size
for w in range(1, width + 1):
for h in range(1, height + 1):
if img_pic.mode == 'RGB':
r, g, b = img_pic.getpixel((w - 1, h - 1))
elif img_pic.mode == 'RGBA':
r, g, b, a = img_pic.getpixel((w - 1, h - 1))
hex_rgb = int_to_16(r) + int_to_16(g) + int_to_16(b)
cell = worksheet.cell(column=w, row=h)
if h == 1:
_w = cell.column
_h = cell.col_idx
# 調整列寬
worksheet.column_dimensions[_w].width = 1
# 調整行高
worksheet.row_dimensions[h].height = 6
cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)
print('write in:', w, ' | all:', width + 1)
print('saving...')
workbook.save(out_file)
print('success!')
if __name__ == '__main__':
draw_jpg('mona-lisa.jpg')
附
上面說到 顏色數量*單元格數<閾值(256^4左右)
的時候,可能有人會有疑惑,這個256^4
是怎麼來的。
這個當然是我測試信口開河得來的。
既然是有顏色數量
跟單元格數
這兩個變量,那麼自然要有兩個測試方法以上。一個觀察顏色數量
,一個觀察單元格數
。
但我在這裏只做了顏色數量
的一個測試。(最大的原因就是生成上萬行*上萬列的 excel 實在是太久了…懶…)
count = 0
MAX_WIDTH = 255
for w in range(1, MAX_WIDTH + 1):
for h in range(1, MAX_WIDTH + 1):
cell = worksheet.cell(column=w, row=h)
if h == 1:
_w = cell.column
_h = cell.col_idx
# 調整列寬
worksheet.column_dimensions[_w].width = 1
# 調整行高
worksheet.row_dimensions[h].height = 6
if count < 255 ** 3:
back = int_to_16(num=count)
back = '0' * (6 - len(back)) + back
else:
back = ''.join([int_to_16(random.randint(0, 255)) for _ in range(3)])
cell.fill = fills.PatternFill(fill_type="solid", fgColor=back)
count += 1
count
是記錄顏色的變量,確保每一個顏色都不重複,但目前計算機 RGB 表示的顏色最多隻有 256^3 種通過調整
MAX_WIDTH
的值來測試 excel 的閾值
最後生成的測試 excel 如下:
…還有點好看。!??
最後
由於精力有限 懶,能力也有限 菜,所以沒有測試單一顏色的,也可能有其他的方法能沒有這個閾值的限制。
代碼已經全部上傳至github,歡迎大家友好交流討論 [握手]