内田洋行とPKSHA Technologyは、埼玉県戸田市教育委員会と共同で、教育データを活用したAI不登校予測の実証実験を実施した。教育データというセンシティブなデータをいかに安全に活用するかという点について話を聞いた。
内田洋行とPKSHA Technologyは、2023年度(令和5年度)にこども家庭庁が実施した「こどもデータ連携実証事業」に採択された埼玉県戸田市教育委員会と共同で、教育データを活用したAIによる不登校予測の実証実験を実施した。
本記事では、AIを使った不登校予測の是非ではなく、教育データというセンシティブなデータをいかに安全に活用するかという点について、内田洋行の武田考正氏(ICT&プロダクツデベロップメント事業部)、PKSHA Technologyの眞鍋優氏(AI Solution事業本部ビジネスディベロップメント/ シニアプロジェクトマネージャー)、岩井智夢氏(AI Solution 事業本部 リードアルゴリズムエンジニア)に話を聞いた。
「子どもたちが誰1人取り残されない」教育を掲げる戸田市教育委員会は、デジタル、データ活用による教育政策の推進に力を入れている。2019年に「教育政策シンクタンク」を設置し、有識者を交えたアドバイザリーボードを開催して、教育データの適切な利用について議論を重ねてきた。
教育データの活用では、子どもに関する各種データを部局を超えて収集して課題を発見し、先手を打つプッシュ型の支援を検討してきた。なかでも不登校やいじめの対策をモデルプランとして掲げており、今回のこどもデータ連携実証事業では、その1つである不登校の予兆を予測するAIの開発にフォーカスを当てた。
文部科学省の不登校調査資料によれば、小中学生が不登校になる原因として考えられる要素は多岐にわたっている。学校や家庭などさまざまな状況での問題が原因となるが、子どもたちが困難に感じているとき、何らかのSOSを発している可能性がある。そのサインを、学校が記録している各種データを基に早期に発見すれば、不登校になる前にケアができるのではないかというのが、今回の実証実験の背景にある。
教育分野のデジタル活用では多くの実績を残している内田洋行は、戸田市の事業に連携事業者として参加し、データ活用部分のプロジェクト全体を管理する役割を担った。そして、高いAI開発力を持つPKSHA Technologyが内田洋行からの協力要請を受け、プロジェクトに参加した。同プロジェクトには他にも支援機関とデータベース周辺のシステム構築を担当する企業が参加した。
本実証実験は、2023年11月に戸田市内のパイロット校での試行をスタートし、同年12月から2024年3月まで、全18校の小中学校に展開した。
戸田市の教育委員会が取得、記録しているデータは約20種類に及ぶが、氏名や性別といった個人情報そのものは実証実験に使用されず、外部連携もされない。学校が実施する児童生徒へのさまざまな調査(学習状況や授業の理解度調査、いじめなどに関する調査)や、学校側が記録している児童生徒の出欠状況や保健室の利用状況などを収集し、個人が特定できない形で外部と連携した。
これらの学校が保存するデジタルデータは、仮名化した上でクラウドサービス(今回は「Google Cloud」を使用している)に展開。内田洋行とPKSHA Technologyは、この仮名化されたデータを活用した。
データの取得に当たっては児童生徒本人とその保護者に、取得するデータと保管方法、活用目的、安全性の確保について説明した。説明は市の広報誌などで本人や保護者以外にも周知した。
具体的には、最初に2022年度の教育データを取り込んでAIモデルに学習させ、そのモデルで2023年度の教育データから予測を実施し、不登校の予兆をスコア化。1学期(4月〜8月まで)のデータを基に、2学期(9月以降)に不登校になる予測と、期間を延ばした4月〜10月までのデータで、11月以降の予測をする2回に分けて実施し、それぞれ学校にフィードバックした。学校側では、提供された予測スコアが、学校が把握している不登校の状況と、どの程度合致するのかを検証した。
実際に学校にフィードバックされた不登校予測のデータは、どのような評価だったのだろうか。内田洋行の武田氏は次のように話す。
「戸田市からは、予測スコアによる結果と、学校側の不登校児童生徒の把握状況とが8割程度一致したという連絡をもらっており、かなりの精度の高さを確認できました。特に今回の実証実験では、更新頻度が低いデータが中心だったなかでもこの精度を出せたため、更新頻度が高いデータを加えることができれば、さらに精度を上げられる期待を持ちました」
戸田市が取得している児童生徒のデータには「シャボテン(心の天気)」というものがある。これは児童生徒自身が今日の気持ちを天気予報に例えて入力するデータだが、まだ市内3つの小学校でしか採用されていなかった。そのため、今回の実証実験ではAI開発の対象から除外されている。こうしたデータが多くの学校で蓄積されはじめ、AI開発にも利用できれば、さらに予測の精度を高められるかもしれない。情報の鮮度と量がさらに充実することで、AIによる予測の価値は高まるはずだ。
また、8割程度が学校側の把握状況と一致していたことに加えて、市内で約10人の児童生徒が、AI予測によるリスクスコアが高かったが学校のスコープには入っていなかったという。市の教育委員会では、その約10人も見守り対象者に加えてケアしている。これもAI導入の成果の1つといえる。
戸田市教育委員会による不登校児童生徒のAI予測実証研究事業は、2023年度に実施され、上記したような成果を確認した。1年限りの事業だったため以降は実施されていないが、内田洋行とPKSHA Technologyでは、データ連携実証事業の成果とともに、教育データの活用における課題も実感したという。
「まず、元になるデータの保管場所が分散しており、データのフォーマットも共通ではありません。加えて、同じ学習ドリルの結果でも、年度が変わると特定の項目のデータが全角から半角に変わっていたというようなこともありました」(PKSHA Technology)
データのフォーマットがずれてしまうと学習に支障が出るため、PKSHA Technologyでは発見次第都度データの修正を依頼して対応してもらった。戸田市側のデータの調整にかけた時間は相当なものだったと推察している。
「今回は実証実験のため、データ連携の自動化はしておらず、データ連携によってどういうことができるかの検討として、AIによる不登校予測の検証をしました。データの整備の都合もあって単年度のデータを学習していますが、当社としては年度をまたいだ複数年分のデータも活用したいと考えており、そのためにはデータの整備と連携の自動化が必要だと考えています」(PKSHA Technology)
年度を超えたデータを活用できれば、モデルの精度を向上させ、悩んでいる子どもをより早期に発見できる可能性がある。PKSHA Technologyでは今回の実証実験の結果から、データ次第でそのような支援も十分に可能だと考えている。
「不登校というセンシティブなテーマであることから、各学校におけるスコア自体の閲覧も、役職者以上に限定するなど、慎重に取り扱っていると伺っています」(武田氏)
また、今回の実証実験でAI開発に使用したデータはほとんど数値のデータに限定されており、フリーテキストは学習できていない。保健室の利用などについて、利用日や時間などに加えてなぜ利用しているかなどのヒアリング結果も取り込むことができれば、よりAIの精度を上げることもできそうだという。
今回の実証実験を通じて内田洋行、PKSHA Technologyはともに、教育データのAI活用について手応えを感じている。武田氏は次のように話す。
「子どもたちは不登校だけでなく、いじめなどさまざまな困難に直面しており、この解決は国としても大きな課題です。これまでも教育現場のデータ活用を支援してきた当社としては、今回のプロジェクトでは、ただデータを開発して提供するだけでなく、データの種類や意味、更新頻度、時期など、データを利活用する際の特性を十分に捉えながら現場のニーズに合わせたデータ活用のあり方を設計することができました。今後もセキュアでプライバシーに十分配慮した形で、この課題の解決に今後も取り組んでいきたいと考えています。ただ、その前提としてデータが分断している問題もありますので、まずはデータをスムーズにつなげるためのシステム作りや運用の支援を進め、現場に寄り添ったより効果的な支援に繋げていきたいと考えています」
PKSHA Technologyは教育現場や社会に対して、対話型AIによる学習支援や、孤立支援などについて研究と実装も進めている。
「このようなデータの整備や解釈のプロセスは、かつては膨大な時間と労力を要しましたが、今後は生成AIを活用して迅速に解決していくべき課題だと考えています。AIを単なる分析ツールではなく、人の可能性を引き出すためのテクノロジーとして社会に実装していく上で、この視点は不可欠です」(PKSHA Technology)
子どもの不登校というセンシティブな問題にあえて踏み込み、AIによる予測の可能性を確認した今回の実証実験は、AIによる社会課題の解決に向けたアプローチとして注目される。さらなる検討を重ね、適切な形で教育現場への実装が進むことを期待する。
Copyright © ITmedia, Inc. All Rights Reserved.