自己教師あり学習とは？LLM事前学習の中核技術｜士業AI用語集

自己教師あり学習とは

自己教師あり学習（Self-Supervised Learning）は、ラベル付けされていない大量のデータから、タスクを自動的に作り出して学習する手法です。GPTやClaudeなどLLMの事前学習を支える中核技術でもあります。

仕組み

人手のラベルを必要とせず、データの一部から残りを予測させる形でタスクを作ります。

次の単語を予測（GPT系の基本）
一部を隠して当てさせる（BERT系のマスク予測）
画像なら、一部を切り取って元画像との関係を学習

「自分自身がラベルを生成する」ため、自己教師ありと呼ばれます。

他の学習との違い

教師あり学習: 人間が付けた正解ラベルが必要
教師なし学習: クラスタリング等、正解そのものがない
自己教師あり学習: 正解は人手不要で自動生成されるが、学習は教師ありに近い形で進む

つまり「人手に頼らず、しかし正解がある学習」という位置づけです。

なぜ重要か

Web上の膨大なテキスト・画像・音声をラベル付けなしにそのまま活用できるため、LLMのような大規模モデルの事前学習が可能になりました。現在の生成AIブームを技術的に支えている土台です。

士業AIで業務を効率化しませんか？

税務・会計・法務の専門AIが、日々の業務をサポートします。
まずは無料プランからお試しください。

無料で始めるログイン