果実において、糖度は、品質保証、収穫時期の最適化などにおいて重要な指標です。高糖度の果実は、市場での付加価値が高く、一定の糖度を保証したブランド果実も存在しており、果物の糖度測定の需要は年々増しています。
このようなニーズに対して、非破壊で糖度測定が可能な近赤外分光法は、非常に有効な手段です。
本記事では、スペクトルカメラと回帰解析を用いた糖度のデモ測定について紹介します。
デモの内容
概要
糖度計(シンワ測定デジタル糖度計)で測定したぶどうの糖度と、スペクトルカメラと回帰解析で算出した糖度を比較。
スペクトルカメラと回帰解析で求めた糖度が糖度計の糖度を一致するかを評価しました。
サンプル |
ぶどうの果実 50pcs |
スペクトルカメラ |
Hyspex Baldur V-1024 |
スペクトル解析ツール |
Prediktera Breeze |
スペクトルカメラによる糖度測定原理
ぶどうに光を当てると、ぶどうは光を吸収します。
そして、この時吸収される光はぶどうに含まれる成分によって変わります。
糖度の測定に関しては、糖に含まれるグルコースやフルクトースの吸収波長(1400~1450 nm、1900~1950
nm)や、光合成プロセスを通して糖と深く関係するクロロフィルの吸収波長(640〜680nm)の光強度を測定することで、推定することができます。
この時、ぶどうに含まれる水分なども同じように特定の光を吸収することに注意が必要です。
そのため、統計解析などを用いて要因を分離し、精度の高い解析を行う必要があります。
デモ手順
今回のデモの手順を以下に紹介します。
Step1スペクトルの測定
Hyspex Baldur V-1024を使用して、ぶどうの果実(50pcs)の透過スペクトルを取得します。
Step2糖度(測定値)の測定
ぶどうを潰して、糖度計(シンワ測定デジタル糖度計)で糖度を測定します。この時、測定された値をリファレンス(測定値)として使用します。
Step3スペクトルの回帰解析モデルの作成
50pcsの中から39pcsのぶどうを抽出し、測定した透過スペクトルと糖度計で測定した糖度(測定値)から回帰解析モデル(検量線)を作成します。
Step4回帰解析モデルを使用した糖度の推定
解析モデルの作成で使用していない11pcsのぶどうの糖度を推定し、糖度計で測定した糖度(測定値)と比較評価します。
デモ環境(測定機器)
糖度の吸収を直接的に測定するには、O-H結合、C-H結合、C=O結合に由来する近赤外光(NIR)の吸収波長が一般的に使用されますが、今回は「糖度がクロロフィル濃度と反比例する」という特性を活かし、クロロフィルの吸収帯である640〜680nm(可視光領域)を使用しました。
可視光用のスペクトルカメラは、近赤外のスペクトルカメラと比較して解像度が高く、測定が高速で行えるモデルが多いため、コストパフォーマンスにも優れ、インラインでの使用にも最適です。
また、果実の内部全体に含まれる糖度がより正確に反映されるよう、今回は透過法を用いて測定を行いました。
スペクトルカメラ
今回は、多くの可視光領域のスペクトルカメララインナップから、インライン導入に適したモデルを選択しました。
Hyspex Baldur V-1024
HySpexのBaldurシリーズは産業向けに開発された高速撮影が可能なライン型のスペクトルカメラです。
シリーズ内で最も高い性能を誇るモデルである「V-1024」は、1024画素の空間分解能と1000fpsの高速撮影を誇ります。
波長範囲 |
400-1000nm |
最大フレームレート |
1000fps |
空間分解能 |
1024画素 |
寸法 |
316x105x153[mm] |
重量 |
4.2kg |
ステージ
ステージは、透過測定を行うためのステージを使用しました。
光を透過ステージの裏面から照明を当てて、ぶどうと通過した光をカメラで捉えます。
ステージは、光源からカメラまでの光路の均一性の確保や振動が与える影響の低減、スペクトルカメラとの連携など高精度で再現性のあるデータを得るために重要な役割を果たします。
ケイエルブイでは、スペクトルカメラ、光源と合わせて適切なステージをご紹介します。→お問い合わせ
光源
光源には、ハロゲンランプを使用しました。
ハロゲンランプは、スペクトルカメラの波長範囲である400-1000nmにおいて、比較的安定した光強度を持つため、分光分析で広く使用される光源です。
ハロゲンサイクルによってフィラメントの蒸発が抑制るので、ランプ光源の中では長時間にわたり安定した光を供給できる特性があり、分光分析のインライン計測でも頻繁に採用されます。
光源の選定は、測定波長をカバーしているかだけではなく、出力の強度、安定性、寿命などを含めスペクトル解析の精度の面でも重要です。
光源の種類は、ランプだけではなくLEDやレーザー励起光源など多岐に渡ります。ケイエルブイはスペクトル解析向けの専用光源なども取り扱っておりますので、ご相談ください。お問い合わせ
測定結果(取得スペクトル)
スペクトル
撮影したぶどう(果実部)のスペクトルを以下に示します。
クロロフィルの吸収帯である650〜680nm付近に吸収が見られます。
スペクトルの波形の幅は、スペクトルのばらつきです。
このばらつきが画像でどのように発生しているのかを擬似RGBで確認しました。
擬似RGB
擬似RGBは、スペクトルの特定の波長を赤(R)、緑(G)、青(B)に割り当てた画像です。
上下のぶどうの色が異なって見えるのは、ライン光源の輝度ムラによるものと考えられ、スペクトル波形に発生していた幅もそれが原因ということが推測されます。
解析結果(スペクトル解析)
スペクトル解析ツール
Prediktera Breeze
「Breeze」は、ハイパースペクトルイメージング向けのスペクトル解析ソフトウェアです。
オブジェクト識別、画像セグメンテーション、スペクトル解析、機械学習モデルの適用などを、産業のインライン向けに簡単に組み込むための豊富な機能が搭載されています。
前処理
今回の試行では、回帰解析の準備段階として、各ぶどう粒を画像解析によって抽出し、それぞれの粒に対応する糖度データを紐付けました。この工程は、スペクトル特徴量と実際の糖度との関係を明確にする上で重要なステップとなります。
今回、スペクトル解析に使用した「Breeze」は、スペクトル解析だけでなく、オブジェクト抽出を含む画像処理も含め、ノーコードで簡単に実現できます。
通常であれば、各ぶどう粒の領域を手作業で一つずつ指定する必要がありますが、「Breeze」を活用することで、解析対象とするぶどうの粒を効率的に抽出することが可能です。
さらに、スペクトルの前処理として「2次微分」を行いました。
2次微分は、1次微分の傾きを求めることで、スペクトルの変化量の変化が大きい部分を強調する手法です。これにより、”ノイズの低減”や”吸収ピークの強調”が可能となるため、スペクトル解析の前処理として非常に効果的です。
スペクトル解析(回帰解析モデル作成)内容と結果
前処理を施した後、2次微分したスペクトル波形と糖度の測定値を用いて重回帰解析を実施しました。
スペクトルデータを用いた重回帰解析は、各波長における光の吸収強度を説明変数として、目的変数である糖度への影響を解析する手法です。
この解析により、スペクトル情報と糖度との間の関係性を定量的にモデル化することが可能となります。
また、複数の波長を同時に解析することで、単一波長では捉えきれない複雑な特徴をモデルに反映させることができ、より高精度な定量化を実現しています。
このグラフは、ぶどう50pcsの糖度に関して、実際に糖度計で測定した「測定」と、透過スペクトルから回帰解析モデル(検量線)を用いて推定した「推定値」を比較したものです。
理想的には、すべての点が45度の黒い直線上に位置するため、各点がこの線に近いほど実測値と推定値が一致していることを意味し、モデルの精度が高いと判断できます。
検量線の作成に使用した39pcsのブドウの糖度と推定値は赤色、、検量線の作成に使用していない評価用の11pcsのぶどうは緑色の点で示しています。
検量線の作成に使用したブドウ(赤点)だけでなく、評価用のブドウ(緑点)に関してもスペクトル解析によって求めた推定値と実測値の相関が取れていることがわかります。
今回の重回帰解析の結果をより定量的に評価する場合、R²(モデルが学習データをどれだけ正確に再現できているか)やQ²(未知データへの予測精度)といった値を用いることが一般的です。
これらの数値の内容も含めてご紹介します。
モデルが学習データをどれだけ正確に再現できているか
モデルが学習データの実際の数値パターンをどれだけ正確に再現できるかを以下の数式から計算される「R²」で表します。
R² = 1 - (Σ (yᵢ - ŷᵢ)²) / (Σ (yᵢ - ȳ)²)
ここで、yᵢは測定値、ŷᵢはモデルによる推定値、ȳは測定値の平均を表します。
Σ (yᵢ - ŷᵢ)²
はモデルの推定値と測定した測定値の差の2乗で「予測の誤差の大きさ」です。
Σ (yᵢ - ȳ)²
は「測定値の平均からのばらつき」です。
モデルの予測がまったく機能していない場合、「予測の誤差の大きさ」がばらつきと同じになり、R² =1-1=0となります。
一方、モデルの予測が完璧な場合には、測定値とモデルの推定が等しくなるので、R² =1-0=1となります。
つまり、R²は「1から、”モデルが説明できなかった誤差の割合”を引いた値」であり、値が1に近いほど、モデルが実際のデータのパターンをよく再現できていることを意味します。
今回のモデルのR²は"0.77"で比較的良い適合といえます。
未知データに対してのモデルの予測精度
モデルの未知データに対する予測性能を示す指標として、学習に使用していないデータを用いた評価から算出される「Q²」を使用します。
Q² = 1 - (Σ (yᵢ - ŷᵢ_eval)²) / (Σ (yᵢ - ȳ)²)
ここで、yᵢは測定値、ŷᵢ_evalは評価データに対するモデルの推定値、ȳは測定値の平均を示します。
この指標は、学習データに対する適合度を示す「R²」とは対照的に、未知データに対する予測性能(モデルの汎用性)を評価するためのものです。
理想的には、R²とQ²の両方が1に近い値であることが望まれます。もし、R²は高いにもかかわらずQ²が低い場合、学習データに対して過剰適合(オーバーフィッティング)が発生している可能性があり、学習データの選定やモデル構築の見直しが必要となります。
今回のモデルのQ²は"0.44"で悪い値ではないですが、R²との間に若干の乖離があるため、改善の余地があることもわかります。
最後に、もう少し詳しく、テストデータの測定値と推定値の確認結果を確認していきます。
想定値と推定値の差分は大きいもので1.052%の誤差が出ていますが、標準偏差より±1.45%以内で推定できており、今回のデモで必要な糖度の精度は得られていると判断しました。
まとめ
今回、ぶどうの糖度の推定を対象に、糖度計で実測した糖度に対する 「ぶどうの透過スペクトルと多変量解析の回帰解析モデルを使用した推定値の有効性」を評価を実施しました。
- HyspexのスペクトルカメラとBreezeの回帰解析を組み合わせることで、簡単に高精度なぶどうの糖度測定モデルを作成可能
- 作成したモデルは、モデルに使用していない未知のデータに対しての糖度差は最大で1%程度
- スペクトル解析は、果実の品質管理への貢献が可能
ケイエルブイはスペクトルカメラや多変量解析の導入を検討されているお客様向けにデモサービスも行っております。
デモに関してご興味のある方は、ご相談ください。お問い合わせ