人気テーマ

「データに基づいて判断し、意思決定を行う能力」が最重要のコア
目指すのはハイレベル人材の育成と同時に日本社会全体の底上げ《「数理・データサイエンス・AI」は学ぶと働くをどう変えるか Vol.1》
2025/05/28
データサイエンス教育が注目を集めている。多くの大学・高専が文部科学省「数理・データサイエンス・AI教育プログラム認定制度(MDASH)」の認定を受けているほか、データサイエンス関連の学部・学科・課程を新設する動きも盛んだ。「数理・データサイエンス・AI教育強化拠点コンソーシアム」の会員校も現在360校を超える。コンソーシアムの企画推進ワーキンググループ主査の河合玲一郎氏(東京大学 数理・情報教育研究センター教授)、副主査の林和則氏(京都大学 国際高等教育院附属データ科学イノベーション教育研究センター教授)に、データサイエンス教育の現状と、今後の展開や課題について聞いた。
聞き手:近藤賢(「キャリアの広場」編集部)
より多くの学生を対象に日本社会全体の底上げを図る
―――データサイエンス教育が大きな注目を集めるようになったのは、MDASHが始まった2021年頃からと思いますが、コンソーシアムはそれ以前から活動されています。設立の背景やこれまでの経緯はどのようなものだったのでしょうか。
林 :2010年代前半頃から、データ駆動型の考え方が世界的に重要な潮流となり始めていました。その世界的な進展に遅れないよう、国内でも適切な分野の学生に適切な教育を提供する必要があるという認識が文部科学省を中心として共有されたことが、このコンソーシアム設立の大きな動機になりました。
「数理・データサイエンス教育強化拠点コンソーシアム」としてスタートしたのが2017年度です。海外の動向に後れを取ることが多かった日本において、世界的な動きに大きく遅れることなく対応できたことは特筆すべき点です。コンソーシアムで策定したモデルカリキュラムを基盤として、文部科学省の「数理・データサイエンス・AI教育プログラム認定制度」のリテラシーレベルが2021年度、応用基礎レベルが22年度に始まりました。大学広報につながるインセンティブのある認定制度は、データサイエンス教育の普及を後押ししたと思われます。最近注目されている生成AIなどの技術も、すでに構築されていた教育プログラムの上にスムーズに導入でき、2022年度からは第2期の「数理・データサイエンス・AI教育強化拠点コンソーシアム」として、新たな体制で活動しています。
河合:第2期になってからも、コンソーシアムとして、データサイエンス教育を始めたいが教員が不足している、どのような教材を使えばいいかわからない、といった共通の課題を抱える大学に対するサポートに尽力してきました。具体的には、モデルカリキュラム策定、教材の共有、演習に適したデータセットやPBLケースの提供などです。
それらのミッションと並行して、11拠点校については数理・データサイエンス・AI分野におけるエキスパート人材育成を促進する役割も担っています。
学生に身につけてほしい力はどの分野でも共通
―――データサイエンスの能力は、「どの業種・職種でも求められる汎用的な力」として位置づけられるのでしょうか。
林 :私たちはデータサイエンスの能力の最も重要なコアとなるのは、「データに基づいて判断し、意思決定を行う能力」だと考えています。判断や意思決定は、文系理系を問わず、社会で求められる普遍的な能力ですので、データサイエンスを通じて育成される能力は、あらゆる分野の人にとって必要な汎用的な力といえるでしょう。
河合:私はこの質問にある「求められる」という言葉に、少し引っかかりを感じています。あると非常に便利な能力、というくらいのニュアンスが良いように思います。
つまり、データサイエンスの能力を身につけている人でなければ、データを与えられても「これを分析してみよう」という発想になりません。ただの数字の羅列として素通りしてしまうでしょう。今回、多くの学生がデータ分析の演習授業などでデータに触れ、データサイエンスを一通り学んでいます。その結果、社会に出てデータを与えられた際、大学で履修したデータサイエンスの講義を思い出して、少しでも分析してみようと一歩踏み出すことができるかもしれない。非常に大きな違いはそれではないかと感じています。
さらにいえば、実際の社会ではデータ分析を行っても明確な結論が得られないケースがほとんどです。ですから演習授業では、良い結果が出なくても当たり前という、データ分析の負の側面も教える必要があると思います。
―――実際のビジネスの現場で、限られたデータから安易に一般化した結論を導き出すことへの疑問を持つことができたり、ある種の確率論的な議論ができたりするかどうかが、データサイエンス教育の重要な目標の1つではないかと感じています。
林 :いま「確率論的な」という言葉が出てきたように、確率と統計はセットで語られることが多いですが、まったく異なるものです。確率は数学の中の確率論という分野であり、基本的な論理構造は演繹、つまり一般から特殊へという方法です。しかし統計はまったく逆で、観測された標本から一般的な性質を推論しようとする帰納的な学問分野です。
高校の教科でいえば、実験という特別な結果に基づいて背後にどのような一般的な原理があるのかを考える物理が、統計やデータサイエンスと同じ帰納的なアプローチです。高校では統計が数学の1分野のように扱われることもあって、数学や物理の問題を解くという観点で能力が高い学生でも、帰納と演繹の考え方の根本的な違いをきちんと理解していることは少ないのです。そのため、統計学やデータサイエンスは数学とは異なるということを明確に伝え、偶然得られた特殊なデータから背後にある一般的な性質を安全に推論するレシピを提供するものだと教えています。
必要な知識・スキルは、社会に出ると大きく枝分かれする
―――データサイエンス教育を通じて学生に身につけてほしい力は、「学び方は学部系統によって異なるが、身につけるべき力は共通である」というものでしょうか。それとも、「学部系統によって卒業後に社会で求められる力が異なる」ことを前提に、それぞれ異なる力を身につけるのでしょうか。
林 :このコンソーシアムでフォーカスしている比較的基礎的な段階のデータサイエンス教育においては、どの分野でも共通の能力を育成することを目標としています。認定プログラムの要件にも、特定の分野に特化した項目は設けられていません。
ただ、学生のバックグラウンドや興味は学部によって異なるため、教え方は変わってくるでしょう。基本的な内容をそのまま教えるより、学生が関心を持っている分野に関連付けながら教える方が理解を深めやすい場合が多いからです。例えば私は、医学部系のクラスを教える際には治験のデータなどを題材に使うといった工夫をしています。
河合:もう少し踏み込んで考えると、データを実際に利用する現場では、例えば医療系であれば医療データ、金融機関であれば経済データといったように、扱うデータの種類や、利用する上での倫理的な制約、法規制などが分野によって異なります。土台は共通であっても、少し先に進むと、それぞれの分野に応じた倫理や法規などを学ぶ必要が出てきます。
―――社会に出るとリテラシーレベルや応用基礎レベルの知識だけでは対応できない現実があるということでしょうか。
河合:そのように考えていただいて良いと思います。大学で学ぶ内容は汎用的なもので良いのですが、社会に出ると一気にドメイン知識が必要となり、そこで大きく枝分かれしていくと考えられます。
林 :例えばデータを扱う上での基本的な倫理はカリキュラムに入っていますが、各分野に応じてとなると、常に変化する社会状況やルールに合わせて教える内容を更新していくのは、リテラシーレベルや応用基礎レベルでは難しいのが正直なところです。
しかし、データサイエンスの基礎を学んだ人なら、社会に出てからそれぞれの分野の知識を習得することで、土台がない人よりもはるかにスムーズにデータを活用できるはずです。社会に出ることを考慮しても、まずは基礎をしっかりと固めておくことには、十分な意義があると思います。
***
Vol.2では、「育成した人材の社会での活躍」を視野に、データサイエンス教育の課題や今後の展望を両氏に聞く。