まずはCHIより始めよ

Human Computer Interaction分野のトップカンファレンスの一つであるCHIの論文を簡潔に紹介していきます。

Reinforcement Learning for the Adaptive Scheduling of Educational Activities

Paper Info

  • title: Reinforcement Learning for the Adaptive Scheduling of Educational Activities
  • link: https://assets.amazon.science/09/52/ef9488314113a1c8488b277956f8/reinforcement-learning-for-the-adaptive-scheduling-of-educational-activities.pdf
  • author: Jonathan Bassen et al. / Stanford University
  • venue: CHI'20

    Summary

  • オンラインコースにおける、強化学習に基づく適応学習カリキュラム作成のモデルを提案、評価した論文
  • action spaceはどの教材をだすか、state spaceはpre-testの結果、どの教材をといたか、といた教材の成績で、提示する学習教材の個数を小さく、学習gainを最大化するようにPPOで学習
  • 2000人ほどのユーザーのデータから、順番に進める、自分で進めるといった手法と比較して、提案手法が離脱率と学習教材数を低いまま学習効果が高いことを示した。

    Comment

  • human-in-the-loop RL につきもののCold Start problemも議論して、報酬関数を設計している
  • 実験の規模が大きい
  • 自分で進める方法が効率的であるが離脱率が大きいという結果は驚き
  • Honorable Mention