この用語をシェア
Few-shot学習とは
Few-shot学習は、極めて少ないデータ(通常クラスごとに1〜10個程度の例)で新しいタスクを学習する機械学習手法です。人間が少ない例から素早く一般化して学べるように、AIシステムも同様の能力を習得することを目指します。
Few-shot学習の種類
1-shot学習(One-shot Learning)
各カテゴリに対してたった1つの例しか与えられない状況での学習です。
5-shot学習(Five-shot Learning)
各カテゴリに対して5つの例が与えられる状況での学習です。
Zero-shot学習(Zero-shot Learning)
ターゲットクラスの例が一切与えられず、テキストや属性情報のみで学習する手法です。
主なアプローチ
1. メタ学習(Meta-Learning)
「学習することを学習する」アプローチで、多数の異なるタスクで訓練し、新しいタスクに素早く適応する能力を習得します。
- MAML(Model-Agnostic Meta-Learning):勾配の初期化を最適化
- Reptile:MAMLの簡略化版
- Meta-SGD:学習率も含めて最適化
2. プロトタイプネットワーク
各クラスの「プロトタイプ」(代表的な特徴)を学習し、新しいサンプルを最も近いプロトタイプに基づいて分類します。
3. メトリック学習
サンプル間の類似度を測るメトリックを学習し、类似したサンプルを同じクラスに分類します。
- Siamese Networks:2つの入力の類似性を学習
- Triplet Networks:アンカー、ポジティブ、ネガティブの3つ組で学習
- Relation Networks:関係性を明示的にモデリング
4. 転移学習ベース
事前訓練済みモデルを新しいタスクにファインチューニングするアプローチです。
応用分野
コンピュータビジョン
- 画像分類:新しいカテゴリの物体を少ない例で認識
- 物体検出:希少な物体の検出
- セマンティックセグメンテーション:少ないアノテーションデータでの領域分割
自然言語処理
- テキスト分類:新しいドメインや言語での分類
- 固有表現抽出:少ないアノテーションでの名前付きエンティティ認識
- 文章要約:特定ドメインの要約モデル構築
音声処理
- 話者認識:新しい話者の少ないサンプルでの認識
- 感情認識:新しい感情カテゴリの学習
- 音響イベント検出:稀な音響イベントの認識
医療・バイオインフォマティクス
- 希少疾患診断:症例数の少ない疾患の診断支援
- 薬物発見:新しい化合物の性質予測
- ゲノム解析:新しい遺伝子機能の予測
評価ベンチマーク
コンピュータビジョン
- Omniglot:1623種類の文字データセット
- miniImageNet:ImageNetのサブセット
- tieredImageNet:階層構造を持つデータセット
- CIFAR-FS:CIFAR-100ベースのFew-shotベンチマーク
自然言語処理
- FewRel:関係抽出タスク
- FewGLUE:GLUEタスクのFew-shot版
- SNIPS:意図認識タスク
最新の研究動向
Large Language ModelとFew-shot学習
GPT-3やGPT-4などの大規模言語モデルは、コンテキスト内でのFew-shot学習が可能で、文脈で例を示すだけで新しいタスクを学習できます。
マルチモーダルFew-shot学習
テキスト、画像、音声など複数のモーダリティを統合したFew-shot学習手法の研究が進んでいます。
ドメイン適応
異なるドメイン間でのFew-shot学習を実現するためのドメイン適応手法の研究が活発です。
課題と限界
データの品質依存
少ないデータでの学習のため、データの品質や代表性が特に重要で、バイアスの影響を受けやすいです。
ドメインギャップ
訓練時のドメインとテスト時のドメインの違いが大きい場合、性能が大幅に低下する可能性があります。
計算コスト
メタ学習やニューラルアーキテクチャサーチなどの手法は、大量の計算リソースを必要とします。
将来の展望
Few-shot学習は、ラベル付きデータの作成コストが高い現実的な問題を解決する重要な技術です。今後、Foundation Modelやマルチモーダル学習との組み合わせにより、さらに実用的で効率的な技術へと発展し、AIの民主化と実用化を加速することが期待されています。
