ChatGPTに宿題をやらせると成績は下がる?——生成AIと学習の科学を研究者が読み解く

結論を先に言えば、生成AIで学力が上がるか下がるかは「使い方しだい」です。答えを写す使い方は成績を下げうる一方、足場として使えば伸びうる——これが現時点の研究が示す姿です。保護者の方からよく「ChatGPTで宿題をやらせたら、うちの子は考えなくなるのでは」とご相談を受けます。本コラムでは、教育とAIを研究する立場から、実証研究と公的ガイドラインに基づいてこの不安に正面から答えます。なお生成AIの学習影響は研究が新しく結論が動きやすい領域のため、本稿は「現時点の研究では」という留保のもと、害を示す研究と益を示す条件を両方並べて記します。

生成AIと「学習に使う」とはどういうことか

生成AI（Generative AI）とは、ChatGPTに代表される、文章や画像などを自動で生成する大規模言語モデル（LLM）系の技術を指します。本コラムで問題にするのは、生徒・学生がこれを「自分の勉強や宿題に使う」場面です。

ここで重要なのは、同じ「AIを使う」でも中身がまったく違うという点です。大きく分けると、(1)問題の答えや作文そのものをAIに出させて写す「答えをもらう使い方」と、(2)考え方のヒントや問い返し、誤りの指摘を引き出す「足場として使う使い方」の二つがあります。研究を読み解くうえでは、この二つを混同しないことが出発点になります。実際、Mollick & Mollick (2023, SSRNワーキングペーパー) は、学習のためのAI活用と作業代替としてのAI利用は設計段階で区別すべきだと論じ、AIに答えを与えさせず問い返させる「足場」の具体的な使い方を提案しています。

研究が示すこと（1）「答えをもらう使い方」の害

まず、保護者の不安を裏づける研究から見ていきます。最も注目された一次研究が Bastani et al. (2025, PNAS) です。トルコの高校で約1,000名の数学の生徒を3つのグループに分けたランダム化比較試験（RCT）で、制限なしのGPT-4を使えるグループは、AIを使った練習中の成績が48%も上がりました。ところが、AIを使えない期末試験になると、AIを使わなかったグループより17%も成績が低かったのです。練習中の見かけの好調が、定着した学力にはつながっていなかったということです（同論文には訂正版も公表されています）。

同様の構図は別の研究でも見られます。Gyimothy et al. (2025, arXivプレプリント) は、AIの利用を全面的に許可したグループが、紙ベースの知識確認テストで前年から大きく成績を落としたと報告しています。ただしこちらは査読前のプレプリントで、単一大学・単一科目、しかも大学院生を対象とした研究のため高校生・中学生にそのまま当てはめるのは慎重であるべきで、「全面許可」という極端な条件である点にも注意が必要です。

なぜこうなるのでしょうか。学習科学には「望ましい困難（desirable difficulties）」という考え方があります。少し思い出しにくい、少し難しい状態で自力で処理することが、かえって長期の記憶と理解を強くする、というものです。AIが先回りして答えを出してしまうと、この負荷が消え、自分で考えるという肝心の作業が起きません。Tankelevitch et al. (2024, CHI／同会議の最優秀論文) は、この点を理論面から補強しています。生成AIを使いこなすには本来「目標を自覚し、出力を評価し、修正する」という高度なメタ認知が要りますが、AIが答えを出してしまうとメタ認知を働かせる機会そのものが消えてしまう、というのです。

ここまでのまとめ：「答えをもらう使い方」は短期の成績を上げても、AIなしで問われる場面の学力を下げうる——これは複数のRCTで確認されつつある現象です。鍵は、自分で考える機会が奪われてしまうことにあります。

研究が示すこと（2）「足場として使う」と伸びうる条件

一方で、生成AIが学力を伸ばしうることを示す研究も同じくらい確かに存在します。違いは設計にあります。Kestin et al. (2025, Scientific Reports) は、ハーバード大学の物理の授業で約180名を対象にしたRCTで、教師の講義と同じ教育学的な原則で設計された目的特化型のAIチューターを使ったグループが、最先端のアクティブラーニング授業のグループの約2倍の学習効果を上げたと報告しました。しかも、より短時間で学び、動機づけも高かったといいます。

英国の中学生165名（5校）を対象にした Sharma et al. (2024, arXivプレプリント) でも、人間のチューターの監督下で使われた足場型のAIは、固定的なヒントだけのグループ（正答率65%）に対して91〜93%の正答率を示し、初めて見る問題への応用でも人間チューターを上回る成功率でした。AIの返答に有害な内容はゼロ、事実誤りも0.1%だったと報告されています。ただしこれは査読前のプレプリントで、開発元がGoogleであることや、人間の監督が前提である点には留意が必要です。

こうした「適切に設計されたAIチューターは一斉授業を上回りうる」という見方には、もっと古くからの土台もあります。Ma et al. (2014, Journal of Educational Psychology) のメタ分析（73研究）は、知的チュータリングシステム（ITS）が通常授業に対して平均効果量g=0.42という相応の効果を持つことを示しました。ただしこれは生成AI以前のシステムが対象で、現在のLLM型チューターにそのまま当てはめるのは慎重であるべきです。これらを整理したレビュー論文 Jose et al. (2025, Frontiers in Psychology) も、AIには認知を強める証拠と、過度の利用で受動的学習や「認知オフロード（自ら考える機会の喪失）」を招く危険の両面があるとし、「AIは代替者ではなく支援者として設計されなければならない」と結論づけています。

これら益を示す研究に共通するのは、AIが答えを与えず、ヒントや段階的な問い返し（ソクラテス的な問いかけ）、フィードバックを通じて生徒に考えさせる、という「ガードレール付き」の設計です。逆に言えば、汎用のチャットボットをそのまま使うことと、これらの研究が扱った設計型チューターの効果は、区別して考える必要があります。

OKな使い方とNGな使い方の対比

研究が示す違いを、家庭で使える形に落とし込むと次のようになります。要は「答えを出させる」か「考える足場にする」かです。

下げうる使い方（NG）

宿題の問題をそのまま貼り付けて答えを書き写す
読書感想文や作文をまるごと生成させて提出する
出てきた答えを検証せず鵜呑みにする
自分で一度も考えないうちにAIに頼る

伸びうる使い方（OK）

まず自力で解いてから、答え合わせと解説役に使う
「答えではなくヒントだけ」「考え方の順序」を尋ねる
間違えた問題の誤りの原因を一緒に探させる
AIの説明を自分の言葉で言い直す・人に説明する

境界線はシンプルです。自分の思考をAIに肩代わりさせていればNG、自分の思考を引き出す足場にしていればOK、と考えてください。同じChatGPTでも、聞き方ひとつでどちらにも転びます。

家庭・学校でのルール（文科省ガイドラインの位置づけ）

では家庭ではどんなルールを決めればよいか。ここで参照になるのが公的なガイドラインです。文部科学省は2024年12月に「初等中等教育段階における生成AIの利活用に関するガイドライン Ver.2.0」を公表し、2023年の暫定版から全面改訂しました。「パイロット校限定」などの制限を外して幅広い活用を促す一方で、生成AIが「思考・判断・表現の代わりをする」使い方、たとえば宿題や作文の丸投げは学習成果の観点から不適切だと明記しています。あわせて、もっともらしい誤り（ハルシネーション）・著作権・個人情報のリスクへの注意も強めています。ここで一点留保すると、このガイドラインは行政の方針・規範を示す参考資料であり、学習成果への影響を実証データで示すものではありません。

国際的にも方向性は一致しています。UNESCO の Miao & Holmes (2023) によるガイダンスは、AIは「人間の代替ではなく補助・拡張」であるという原則を掲げ、教師は批判的思考や好奇心の促進者であり続けると強調しました。

これらを家庭のルールに翻訳すると、次の3点が出発点になります。

自分の答えを書いてからAIに見せる——「望ましい困難」を確保し、自分で考える機会を先に取る。
答えではなくヒント・考え方・間違いの理由を聞く——足場型の使い方に寄せる。
AIの説明を自分の言葉で言い直し、教科書や先生と照合する——メタ認知を働かせ、誤りを検証する習慣をつける。

ソートアップでの考え方

学習塾ソートアップは「答えを渡さず、考える道を一緒に探す塾」を掲げています。生成AIに対する私たちの考え方も、この方針とまったく同じです。AIを敵視して遠ざけるのでも、無制限に使わせるのでもなく、「自分で考える機会を奪わない範囲で、足場として活かす」——これが現時点の研究とも公的ガイドラインとも整合する、誠実な落としどころだと考えています。

ただし、ここまで紹介した知見にはいくつもの留保がつくことも申し添えておきます。実験の教科や年齢層（高校数学・大学物理・中学生のチュータリング等）はばらつきが大きく、文脈への依存度が高いこと。有益な知見の多くは査読前のプレプリントや特定機関のRCTで、再現性が未確認のものが多いこと。そして生成AIの能力は急速に変わり、今年の知見が来年には古びうること。「どんな生徒にも効く」「家庭でも同じ効果が出る」とは現時点では言えません。だからこそ、一人ひとりの状況を見ながら使い方を設計することが要になります。

「うちの子のAIとの付き合い方をどうすればいいか」というご相談も歓迎しています。学習塾コースでは、こうしたAIや勉強法の設計を塾長が一緒に考えます。実際の指導は無料体験授業でご確認いただけます。

よくある質問

ChatGPTに宿題をやらせると成績は下がりますか?

答えをそのまま写させる使い方は、下げる方向に働きうると現時点の研究は示しています。Bastani et al. (2025, PNAS) では、制限なしのGPT-4を使った高校生は練習中の成績が48%上がった一方、AIを使えない期末試験では使わなかった生徒より17%成績が低かったと報告されました。短期の見かけの成績と、定着した学力は別物だと考えるのが安全です。

では生成AIは勉強に使わないほうがよいのですか?

一律に禁止する必要はありません。答えを与えず、ヒントや問い返しで考えさせる「足場」として設計されたAIは、むしろ学習効果を高めうると示されています。Kestin et al. (2025, Scientific Reports) では、教育学的に設計されたAIチューターを使った大学生が、対面のアクティブラーニング授業の約2倍学んだと報告されました。問題は使うか否かではなく、どう使うかです。

家庭ではどんなルールを決めればよいですか?

「自分の答えを書いてからAIに見せる」「答えではなくヒントや考え方を聞く」「AIの説明を自分の言葉で言い直す」の3点が出発点になります。文部科学省のガイドライン Ver.2.0（2024年12月）も、生成AIが思考・判断・表現の代わりをする使い方（宿題や作文の丸投げ）は不適切としており、家庭のルールもこの線で設計すると整合します。

AIが出した答えが間違っていることはありませんか?

あります。生成AIはもっともらしい誤り（ハルシネーション）を生むことがあり、文科省ガイドラインもこのリスクへの注意を促しています。だからこそ「AIの答えを検証する」過程自体が学びになります。出力を鵜呑みにせず、教科書や先生と照らし合わせて確かめる習慣をつけることが大切です。

高須賀惇也（たかすかじゅんや）

学習塾ソートアップ代表・講師。愛媛大学大学院理工学研究科博士後期課程在籍（教育工学・数理情報）。2014年2月、松山市内で開業（2025年7月に現在地の松山市東雲町へ移転）。元ソフトウェアエンジニア。現在は松山市東雲町で小1〜高3を個別指導。研究テーマは「生涯を通して関わるAIチューターの数理モデル」。

ChatGPTに宿題をやらせると成績は下がる?
——生成AIと学習の科学を研究者が読み解く

生成AIと「学習に使う」とはどういうことか

研究が示すこと（1）「答えをもらう使い方」の害

研究が示すこと（2）「足場として使う」と伸びうる条件

OKな使い方とNGな使い方の対比

下げうる使い方（NG）

伸びうる使い方（OK）

家庭・学校でのルール（文科省ガイドラインの位置づけ）

ソートアップでの考え方

よくある質問

ChatGPTに宿題をやらせると成績は下がりますか?

では生成AIは勉強に使わないほうがよいのですか?

家庭ではどんなルールを決めればよいですか?

AIが出した答えが間違っていることはありませんか?

高須賀惇也（たかすかじゅんや）

まずは無料体験から

ChatGPTに宿題をやらせると成績は下がる?——生成AIと学習の科学を研究者が読み解く

生成AIと「学習に使う」とはどういうことか

研究が示すこと（1）「答えをもらう使い方」の害

研究が示すこと（2）「足場として使う」と伸びうる条件

OKな使い方とNGな使い方の対比

下げうる使い方（NG）

伸びうる使い方（OK）

家庭・学校でのルール（文科省ガイドラインの位置づけ）

ソートアップでの考え方

よくある質問

ChatGPTに宿題をやらせると成績は下がりますか?

では生成AIは勉強に使わないほうがよいのですか?

家庭ではどんなルールを決めればよいですか?

AIが出した答えが間違っていることはありませんか?

高須賀 惇也（たかすか じゅんや）

関連記事

まずは無料体験から

ChatGPTに宿題をやらせると成績は下がる?
——生成AIと学習の科学を研究者が読み解く

高須賀惇也（たかすかじゅんや）