コース: Microsoft Azure AIの基礎知識:Azureでのワークロードと機械学習

多クラス分類とは

他クラス分類は、 3以上の結果のいずれかを予測します。 線形回帰や二項分類と同様に、 各観測値には、 ラベルが割り当てられている 必要があります。 ただし、他クラス分類アルゴリズムは、 複数のクラス間で確率を計算し、 各間属値に対して 最も可能性の高いクラスを 特定するのに役立ちます。 例えば、各クラスに対して 二項分類の評価指標を使用し、 すべてのクラスにわたる 指標を集計します。 そして顧客タイプがラベルであり、 予算重視の買い物客、 ブランド愛好者、 滅多に来ない購入者の 3つのクラスが考えられます。 他クラスモデルを学習するには、 他クラスの確率値を計算する アルゴリズムをデータに適合させます。 混同行列は、 二値[分]、 バイナリバージョンを拡張したもので、 検証セット内の各クラスに対する 予測を示します。 一対他アルゴリズムには、 各クラスに対して 二項分類器を作成します。 各関数は、観測値が それぞれのクラスに属する 確率を計算します。 顧客モデルの場合、 予算重視の買い物客、 ブランド愛好者、 滅多に来ない購入者の 3つの分類器が 作成されます。 この3つの分類器の中で、 最も高い確率を持つ者が、 その観測値の顧客タイプとして選ばれます。 例えば、顧客データには、 年齢層、購入履歴、場所、 エンゲージメントレベル、 収入などが含まれます。 これらが特徴となります。 例えば、 出力が 0.2、0.3、0.5 の場合、 それぞれ予算重視の買い物客、 ブランド愛好者、 滅多に来ない購入者の確率を表します。 最も高い値である 0.5 が、その価格を 滅多に来ない購入者として識別します。 多クラス分類器を評価するには、 この目的のために 使用されるアルゴリズムには、 一対他(OvR)と、 多項式アルゴリズムの 2種類があります。 それとは別で、 多項式アルゴリズムは、 全てのクラスにわたる 確率分布を出力する 単位の関数を生成します。 多クラスモデルの評価に関する詳細は、 Microsoft Learn の 多クラス分類学習をご覧ください。 多クラス分類を活用して、 最も可能性高いクラスを予測して、 適切なカテゴリラベルを つけることができるでしょう。

目次