基于近紅外光譜技術的普洱茶生熟茶判別及產地溯源
普洱茶為國家地理標志保護產品,是以云南大葉種茶樹鮮葉為原料,經殺青、揉捻、毛茶干燥,再以自然的方式陳放或經過渥堆轉熟等制成具有獨特品質的普洱茶生茶或熟茶。普洱茶中含有茶多酚、茶多糖、游離氨基酸、等營養活性成分,具有抗腫瘤、抗氧化、降壓減脂、降血糖等功能,受到不同年齡層次消費者的青睞。普洱茶生茶和熟茶的生產工藝不同,消費者通過肉眼就很容易辨別新茶的生茶(灰綠、墨綠色為主)和熟茶(深褐色或褐紅色為主)。但隨著貯藏時間的延長,生茶揮發性組分逐漸發生變化,顏色也逐漸變為深褐色,普通消費者通過感官評價很難識別老生茶和熟茶。由于不同產地普洱茶的營養活性成分、風味物質等組分存在差異,普洱茶的價格差距很大,這就為不法商家謀取利益提供了可能。因此,迫切需要建立科學精準的方法,對普洱茶生熟屬性和產地進行溯源鑒別。
目前,已有學者利用化學成分分析和近紅外光譜技術(NIRS)實現了普洱茶生熟茶的有效識別。這些前期研究中的樣品直接來自普洱茶廠家,雖然保證了樣品來源的真實性,但與市場上銷售的普洱茶可能存在差異。因為市場茶葉經過運輸、倉儲的過程,使得普洱茶的組分發生了變化。消費者實際接觸到的普洱茶產品與在廠家直接獲得的普洱茶,尤其是生茶,在風味上會有一定差異。由于化學成分分析方法一般較繁瑣,不能滿足市場快速識別的需求,因此,借助NIRS對市場上普洱茶進行生熟茶的識別可能更具有實際意義。
近紅外光譜主要反映食品各組分中含氫基團振動的倍頻和合頻,具有快速、無損、綠色等優點,已經在普洱茶發酵程度判別、多糖含量預測、真假識別及其他茶類的產地溯源上廣泛應用。因此,本研究以普洱茶主產區普洱市、西雙版納傣族自治州和昆明市的普洱茶生茶和熟茶為對象,應用NIRS結合化學計量學方法,開展普洱茶生茶和熟茶的判別及不同產地普洱茶的溯源,以期為普洱茶的真實性判定和市場監管提供技術支持和基礎數據。
普洱茶生茶和熟茶判別
在近紅外譜圖的10000—9000cm-1波數處可以清楚地區分大部分普洱茶生茶和熟茶,但在9000—4000cm-1波數,熟茶與生茶出峰位置一致,譜圖重疊,難以辨別生熟茶,且存在2個普洱茶熟茶譜圖在10000—9000cm-1波數處與生茶譜圖重疊,需要借助化學計量學方法進行不同產地生熟茶的識別。
如圖2所示,在PCA中,取普洱茶生茶和熟茶前兩個主成分時,對原變量解釋能力(R2X)累積為0.968,大部分普洱茶生茶和熟茶可以明顯區分開,且由于貯存年份對生茶的化學組分影響較大,生茶較熟茶更分散。但是有2個生茶與熟茶相聚集,有2個熟茶的位置與生茶更接近,甚至有1個生茶與熟茶近似重疊(箭頭所指),證明老生茶化學組分中所含氫基團綜合與熟茶差異并不明顯,普通消費者通過感官很難識別老生茶和熟茶,也說明了通過PCA難以實現所有生熟茶的識別。因此,需要運用有監督學習算法PLS-DA來提高生熟茶的識別正確率。
普洱茶生熟茶PLS-DA模型的主成分數、主成分數對原變量的解釋能力(R2X)和生熟茶識別正確率見表1。**個主成分對原變量的解釋能力為0.714,對普洱茶生熟茶的識別正確率為81.82%,有8個生茶被錯判為熟茶,2個熟茶被錯判為生茶,說明**個主成分包含原變量信息*多,且有些老生茶所含氫基團可能與熟茶更相近。當取前兩個主成分數時,對原變量的解釋能力為0.964,模型對生熟茶的識別正確率為90.91%,有3個生茶被錯判為熟茶,2個熟茶被錯判為生茶(圖3)。PLS-DA模型的前兩個主成分得分圖與PCA前兩個主成分得分圖(圖2)相似,但PLS-DA可以更好地將組間差異不明顯的變量加以區分,圖2中箭頭所指相互重疊的生熟茶樣品,在圖3中則被很好地區分(圓形部分)。當主成分數增加到3時,R2X累積增加到0.994,此時,模型對生熟茶的識別正確率為94.55%,有2個生茶被錯判為熟茶,1個熟茶被錯判為生茶。當主成分數增加到4,R2X累積增加到0.995,模型識別正確率為96.36%,熟茶的識別正確率為100%,仍然有2個生茶被錯判為熟茶,可能增加的主成分中包含更多的熟茶特征成分。當主成分數由4增加到10時,R2X累積逐漸增加,*終增加到1,但是模型對生熟茶的識別正確率沒有發生變化,均為96.36%。當主成分數由10增加到13時,R2X累積和模型識別正確率均無變化。當主成分數增加到14,R2X累積為1,模型識別正確率為98.18%,只有1個生茶被錯判為熟茶,說明所增加的主成分含有更多與生茶特征成分相關的信息。當主成分數增加到15時,模型對生熟茶的正確識別率達100%,說明利用有監督學習算法PLS-DA可以將普洱茶生熟茶完全識別。
不同產地普洱茶產地溯源
由于不同產地普洱茶光譜的主要峰形相似,譜圖存在重疊現象,普洱茶的原光譜(圖1)并不能直接識別普洱茶的產地,可以運用PCA和PLS-DA來輔助實現。
由圖4a知,其一個主成分對原變量的解釋能力為0.818,說明**個主成分包含原變量的信息*多,前兩個主成分對原變量的解釋能力累積為0.977,說明前兩個主成分已包含了樣品的大部分信息。雖然圖4a中生熟茶分別聚集,但是3個產地的普洱茶分散無規律。再將生熟茶分開考察不同產地的溯源情況,由圖4b和4c可知,3個產地的普洱茶也不能被正確溯源。結果表明:不同產地自然環境、種植方式等對普洱茶的影響在光譜中的綜合反映沒有生熟茶中化學組分的影響大,僅通過無監督學習算法PCA的前兩個主成分并不能實現3個產地普洱茶的溯源。
使用有監督學習算法PLS-DA進行普洱茶不同產地的溯源。不同產地普洱茶的PLS-DA主成分數、主成分數對原變量的解釋能力(R2X)和模型產地溯源正確率見表2,其前兩個主成分得分見圖5。PLS-DA的其一個主成分R2X為0.787,模型的溯源正確率僅為47.5%,因此,需要繼續增加建模的主成分數。當取前兩個主成分時,對原始變量解釋能力的累積為0.976,但是溯源模型的正確率反而降低為42.5%,說明其二個主成分可能包含了產地溯源不相關的信息,且圖5可以進一步說明不同產地的普洱茶混合分散,并沒有呈現聚集現象,這與PCA的前兩個主成分得分圖(圖4a)相似。當主成分數繼續增加,對原始變量解釋能力的累積逐漸增加,模型溯源的正確率也在緩慢增加。當主成分數取6時,R2X累積達到約1,但是模型的溯源正確率僅為62.5%,這可能與不同產地普洱茶的含氫基團綜合差異小有關,且光譜數據的原變量數為6224個,即使主成分數大幅度增加,但其所包含的與產地相關的信息增加量卻緩慢增加。*終當取前26個主成分數時,模型的溯源正確率達到100%,雖然主成分數較多,但這是與光譜原始變量數相對應的,證實了PLS-DA可以實現不同產地普洱茶的溯源。
未知類別的普洱茶生熟茶預測和未知產地的普洱茶產地溯源
對于所建模型的預測能力和穩健性,通過市場所采集的未知樣品進行驗證。從圖6可見,PCA和PLS-DA前兩個主成分得分圖中均將10個未知類別普洱茶中的1個判為生茶,其他9個判為熟茶,且表3也證實了當PLS-DA模型的識別正確率為100%時,10個未知類別普洱茶中有1個為生茶,9個為熟茶。以上結果表明,在判別普洱茶類別時,PCA和PLS-DA模型均表現出優良的預測能力和穩健性,可以將模型用于普洱茶生熟茶的識別。
由圖7可知,由于已知產地普洱茶的PCA和PLS-DA前兩個主成分得分圖不能很好地將三地普洱茶進行溯源,且未知產地的樣品也與3個地區已知的樣品混雜,因此,利用PCA和PLS-DA的前兩個主成分得分圖不能實現未知樣品的溯源。由表2可知,當PLS-DA的主成分數增加到26時,已知樣品的溯源正確率為100%,此時,PLS-DA模型對25個未知樣品的溯源結果為5個樣品來自西雙版納,13個樣品來自普洱,7個樣品來自昆明(表4),說明可以利用PLS-DA模型來實現普洱茶未知樣品的產地溯源。
基于普洱茶因生產工藝、產地等造成的其化學組分中含氫基團綜合存在差異,利用NIRS結合無監督學習算法PCA和有監督學習算法PLS-DA進行普洱茶(老)生熟茶類別識別及普洱茶產地的溯源。結果表明:PCA和PLS-DA模型均可很好地實現普洱茶生熟茶識別,且PLS-DA*優模型的識別正確率可達100%;但PCA模型不能實現三地普洱茶的溯源,而PLS-DA*優模型的溯源正確率為100%,說明PLS-DA模型可以實現西雙版納、普洱和昆明三地普洱茶的溯源。
近紅外光譜技術可以替代那些傳統的費時費力的濕化學檢測和色譜檢測。 傅立葉近紅外具有無損,不需要制備樣品和無需使用危險化學品的特點,可以快速準確地用于定量和定性分析。
布魯克的近紅外產品線包括實驗室離線應用的TANGO、MPA II以及過程控制應用的的MATRIX-F。