研究・技術の開発
多変量解析(3):Partial Least Squares (PLS)
加納 学


要旨
PLS(Partial Least Squares)について解説する。PLS は線形回帰手法の1 つであるが、説明変数の数がサンプル数より多い場合にもモデルを構築できるため、Process Analytical Technology(PAT)の主要ツールである近赤外分光分析における検量線作成を含めて、様々な分野で活用されている。PLS の特徴は、説明変数と目的変数を直接関連づけず、説明変数の線形結合で潜在変数を導出し、その潜在変数の線形結合で目的変数を表現する点にある。目的変数が1 個だけの場合のPLS はPLS1 と呼ばれ、目的変数が複数の場合のPLS2 と区別される。本稿では、使用頻度の高いPLS1 のNIPALS アルゴリズムを紹介する。さらに、潜在変数の重要性を示す寄与率と累積寄与率、潜在変数の数を決めるためのクロスバリデーションについて説明する。


Abstract
In this article, PLS (Partial Least Squares) is explained. PLS is a linear regression method that can be applied to cases where the number of input variables is larger than that of samples. Thus it has been widely used in various fields including process analytical technology (PAT), in which calibration models are built for near−infrared spectroscopy. PLS predicts an output variable as a linear combination of latent variables, each of which is derived as a linear combination of input variables. PLS is called PLS1 when only one output variable exists, and it is called PLS2 when multiple output variables exist. Here the NIPALS algorithm for PLS1 is introduced because PLS1 is more popular than PLS2. In addition, proportion and accumulated proportion, which are used to quantify the importance of latent variables, are explained; then cross−validation, which is used to determine the number of adopted latent variables, is explained.