<!–
見出し
–>
※2 Chain-of-Thoughtの略。AIが問題解決や推論を行う際に、人間のように段階的に思考を積み重ねていく手法。最終的な回答だけでなく、そこに至るまでの思考プロセスも含めて生成することで、より論理的で説明可能な推論を実現する。
同様の能力はOpenAI社においてはGPT-o1など実験的なモデルで実現されていましたが、DeepSeek社はそのGPT-o1に並んだと主張しています。GPT-o1では、その学習には大量の人手による微調整が用いられてきたと言われていますが、DeepSeek-R1では強化学習(※3)を大規模に活用し、人手による微調整なしでベースモデルに直接強化学習を適用しました。
KAIGI IDにログインすると、すべての記事が無料で読み放題となります。
「AdverTimes. (アドタイ)」の記事はすべて無料です
会員登録により、興味に合った記事や情報をお届けします
岡田太一(sync.dev Technical Director/Visualization Artist)
岡田太一(sync.dev Technical Director/Visualization Artist)
CG会社のDigital Artist からキャリアを開始。ポストプロダクションを経て、現在はビジュアルクリエイティブ領域にてテクニカルディレクションを担当。得意な分野は映像編集、ビデオ信号とリアルタイム合成、トラッキング関連など。2022年から『ブレーン』で連載中。
岡田太一(sync.dev Technical Director/Visualization Artist)
CG会社のDigital Artist からキャリアを開始。ポストプロダクションを経て、現在はビジュアルクリエイティブ領域にてテクニカルディレクションを担当。得意な分野は映像編集、ビデオ信号とリアルタイム合成、トラッキング関連など。2022年から『ブレーン』で連載中。
この記事の感想を
教えて下さい。
この記事の感想を教えて下さい。