現代化養豬——養殖大數據

 

前言

這幾年養豬行業正在發生革命性的變化,高端豬肉、安全豬肉、品牌豬肉等特色豬肉的出現,一方面保證了食物的質量,另一方面也提升了溢價能力。基於人工智能養的豬,從出生之日起就有自己的數字檔案,裏面記載了豬的品種、日齡、體重、進食情況、運動強度、頻次、軌跡等信息;用視頻圖像分析檢測豬的體態,分析豬的健康狀況;結合聲學特徵和紅外測溫技術,還能對豬的咳嗽等行爲判斷是否患病,做出疫情預警,馬雲家的豬、阿里的“智能豬”就是很成功的例子。


 

一、問題回顧

1.1 問題背景
作爲一個養豬大國,養豬水平相較於發達國家還是存在相當大的差距。據數據統計,歐美國家的母豬一年能夠商品豬的能力在30-40頭,而我國僅能提供17-18頭。近年來,我國的養豬行業正向着現代化、標準化發展。在現代化畜牧養殖場中,往往已實現了半自動化,例如,自動投餵、自動清糞系統、自動環境控制系統等,自動化設備可以反饋一些狀態數據,而且通過傳感器可以收集到一定的結構化數據,同時,需人工判斷與記錄的數據也會很好地按既定格式保存在服務器中,以上我們稱之爲養殖大數據。
1.2 問題解決
數據準備:
a.傳感器採集的飼養方案數據。如溫度、溼度、飼餵飼料量等。未來隨着物聯網技術的發展,將有更多的數據可通過傳感器收集,如體溫、運動圖像等。
b.人工採集並記錄的種豬數據。如品種、胎次、疾病情況、肥瘦程度等。
c.種豬的生產成績。主要是生仔總數和健康仔豬數。其中以健康仔豬數爲最重要的指標,但健康仔豬數佔生仔總數的比例也需考慮提升。
基於收集到的三類數據(a,b,c)解決以下問題
建立關係分析模型,以參數形式表徵自變量對豬的生產成績的影響程度;
對(1)中影響較大的因素記爲顯著因子,建立顯著因子對豬的生產成績的影響的模型,求出最優解或最優解的趨勢。
1.3 研究意義
第一,我國人口較大,需求量巨大,但養豬行業生產水平較低,嚴重影響了我國養豬事業的發展,因此,推動養豬行業的自動化、現代化發展有助於滿足人類的需求,還能銷往鄰國謀取經濟效益;
其次,改善豬肉的質量,杜絕“瘦肉精”的出現,從而人們能夠放心喫肉,敢於喫肉;
最後,隨着技術的應用,促進了對養豬技術的研究,養豬科學探索的深入,不斷產生新技術、新理念,更好地服務於養豬企業。

 

二、模型假設

基於數據,假設豬的生產成績只與溫度、溼度、品種、胎次、肥瘦程度和患病情況有關
假設給出的數據都是有效的
假設沒有重大的疫情導致豬的死亡

 

三、模型建立

3.1 問題分析

 

對於問題(1),建立關係分析模型以參數形式表徵種豬的生產成績的影響程度。由於數據中給出的影響指標有11個之多,包括日平均溫度、日平均溼度、周平均飼餵量、豬品種、肥瘦程度、胎次、是否患藍耳病、是否患圓環病、是否患仔豬黃白痢、是否患病毒性腹瀉以及是否患支原體肺炎,考慮到各變量間並非一定相對獨立,所以決定先根據定性分析和定量分析相結合對其進行分組,即降維,再研究各變量組對豬生產成績的影響。

3.2 指標分組
1)定性分析
定性分析是依據現實經驗和主、客觀分析方法,對於某種事物的本質屬性、發展趨勢或多種事物之間的相關關係基於直觀、概括性表述的一種分析方法。由生活經驗可預測變量間的相關性,從而大致研究以下幾組:
日平均溫度與日平均溼度
品種、飼餵量和肥瘦程度
胎次與是否患病
肥瘦程度與是否患病
品種與是否患病
2)定量分析
定量分析是指在數學方法基礎上,通過研究社會現象的數量特徵、數量關係和數量變化,對發展趨勢進行分析、預測和解釋。

 

 

 

相關性分析

爲了使得效果顯著,先用對數函數對溫度、溼度值進行轉化,再通過excel散點圖分析各變量間相關性,得到圖1-3:
 

分析可知,日平均溫度和日平均溼度的相關係數爲0.0189,所以可以認爲兩者不相關(見圖1);周平均飼餵量與豬的肥瘦程度的相關係數爲0.8197,兩者有較強的相關性,且是負相關的關係,豬越胖,飼餵量就會減少(見圖2);品種與豬的肥瘦程度的相關係數爲0.00001,非常弱,說明兩者完全不相關(見圖2);胎次與豬的肥瘦程度沒有關係(見圖3) 。

 

 

獨立性檢驗分析

由於“是否患病”變量是布爾類型,只有“患病”、“不患病”,即1和0兩種結果,所以不適合用散點圖進行相關性分析,這時可用考慮獨立性檢驗分析法。

獨立性檢驗是檢驗兩個分類變量X和Y是否有關係的一種統計方法,利用隨機變量確定在多大程度上可以認爲“兩個分類變量有關係”,其中令X={x1,x2},Y={y1,y2}。

 

檢驗步驟:

步驟1:假設X和Y有關係

步驟2:建立2×2列聯表

步驟3:計算觀測值

其中觀測值越大,X和Y有關係的可能性越大。

步驟4:對比臨界值表

步驟5:得出結論

 

 

在實現之前,先對數據作以下處理:

鑑於豬的肥瘦程度在12-20之間,故將其劃分爲兩部分,16-20之間表示肥胖,用1表示;12-15之間表示瘦弱,用0表示;

品種1、2分別轉換爲0、1

 

在matlab實現5種疾病、品種與肥瘦程度的相關性程度,得到豬的肥瘦程度與5種疾病、品種的觀測值:

對比臨界值表發現,只有第二種疾病(即圓環病)與豬的肥瘦程度有較大的關係,超過85%的把握認爲兩者有關。

 

3)確定分組

根據前面的分析大致將影響豬的生產成績的因素分爲5組,分別是

A組:日平均溫度

B組:日平均溼度

C組:飼餵量、豬的肥瘦程度、圓環病

D組:胎次

E組:是否患病

3.3 建立模型

1)多元迴歸

設因變量爲y,k個自變量分別爲x1,x2,…,xk,描述因變量y如何依賴於自變量x1,x2,…,xk和誤差項ε的方程稱爲多元迴歸模型。針對5組影響因素建立豬的生產成績的迴歸模型如下:

其中Y表示豬的生產成績,β0表示常數項,βi (i=1,2,3,4,5)表示5個影響豬的生產成績的迴歸係數,Xi (i=1,2,3,4,5)表示A,B,C,D,E這5組影響因素。

2)模型實現

先對變量組做以下處理:

對119個日平均溫度取平均值

對119個日平均溼度取平均值

對17個周平均飼餵量取平均值

針對C組變量,由於三者有聯繫,在這裏只考慮豬的肥瘦程度

對desease1,3,4,5取患病總數

對每個衡量指標進行歸一化(即(x-min)/(max-min))

3)結果呈現

對仔豬總數的分析結果:

 

 

可見,對仔豬數目的影響程度從大到小依次爲胎次、肥瘦程度、患病、溼度、溫度。

 

 

對健康仔豬佔的比例的結果分析:

   

可見,對健康仔豬比例的影響程度從大到小依次爲肥瘦程度、溼度、胎次、溫度、患病數。

4)結果分析

綜合兩者,影響豬的生產成績程度最深的是豬的胎次,其次爲豬的肥瘦程度、患病數,而溫度和溼度對豬的影響不大。

       胎次之所以影響最大,是因爲母豬的最佳生產期爲5~6胎,超過6胎的不僅會影響到生產成績,還會增加養殖成本,所以爲了提高整個生產水平,應該儘可能的淘汰生產了8胎以上的母豬。

      豬的肥瘦程度也對生產成績產生不可估量的影響,一旦母豬過度肥胖,脂肪過剩從而影響胎兒的正常發育,出現各種疾病,特別是圓環病,所以在母豬懷孕期間,控制好豬的飼餵量,進而控制母豬的體重,有利於保證豬的生產成績。

      患病與否直接影響豬的生產性能和仔豬的健康狀況,很明顯患的疾病越多越嚴重,豬的生產成績必定下降越厲害。

 

四、附錄

matlab實現5種疾病、品種與肥瘦程度的相關性程度的代碼

y=xlsread('數據.xlsx','肥瘦與患病','B2:B15001');  %%肥瘦程度
x=xlsread('數據.xlsx','肥瘦與患病','C2:C15001'); %%desease1
%x=xlsread('數據.xlsx','肥瘦與患病','D2:D15001'); %%desease2
%x=xlsread('數據.xlsx','肥瘦與患病','E2:E15001'); %%desease3
%x=xlsread('數據.xlsx','肥瘦與患病','F2:F15001'); %%desease4
%x=xlsread('數據.xlsx','肥瘦與患病','G2:G15001'); %%desease5
%x=xlsread('數據.xlsx','肥瘦與患病','I2:I15001');  %%品種
y=y';
x=x';
n=size(y,2);
a=sum(x==1 & y==1);
b=sum(x==1 & y==0);
c=sum(x==0 & y==1);
d=sum(x==0 & y==0);
k2=n*(a*d-b*c)^2/((a+b)*(c+d)*(a+c)*(b+d))
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章