News On Japan

为什么东京大学的数据科学课程让青少年欲罢不能

TOKYO, Oct 17 (News On Japan) - 东京大学一门快速发展的数据科学课程吸引了不同背景的参与者,包括中学生和高中生,他们与大学生和在职人士一起学习。

这门课程名为GCI,面向全国在线开放,对学生免费,消除了初学者的障碍,并激发了来自日本各地乃至海外的浓厚兴趣。

在最近的一次结业典礼上,主办方报告共有10,579名报名者和1,490名毕业生,显示出该项目严格的要求,结业率仅为14%。“我以为自己可能会在期末任务中失败,但我还是完成了,”一位几乎没有编程经验的初二学生说。GCI每年举办两次,下一期将在10月中旬开始,其受欢迎程度也在全球扩散,吸引了来自32个国家和430所大学的7,700名申请者参加英文版课程。

为了探究课程吸引力的原因,GCI讲师兼AI初创企业研究员世良将之详细介绍了其教学方法,从基础原理到实际应用。世良目前就职于Twins,这是一家由东京大学AI实验室孵化的公司,他将数据科学应用于实际商业问题。“工作范围非常广泛,”他说。“例如,在一家电信公司,我们可以预测客户是否可能解约,并建议他们调整套餐。我们还会评估当前策略是否有效,并在必要时进行调整。”

课程的教学遵循一套结构化流程:探索和清洗数据、构建模型、评估结果并进行迭代。其中一个代表性任务是“Home Credit违约风险”挑战,学生需要根据表格数据(如收入、家庭规模和贷款类型)预测客户是否会违约。训练数据集约有17万行和51列,而测试集约有6万行和50列,违约标签被隐藏。

课程早期强调探索性数据分析(EDA),教学生识别缺失值、异常值和偏态分布。例如,家庭人数和产品价格的缺失值必须在建模前填补。学生还学习到类别不平衡(92%按时还款,8%违约)如何影响结果,以及为什么像AUC这样的指标优于原始准确率。可视化揭示了有用的模式:收入分布在对数变换后更易解读,而某些特征(如教育水平和贷款类型)与违约率有着强烈的相关性。

在建模前,文本类别必须编码为数字,并填补缺失值。虽然one-hot编码通常更安全,但GCI为了简化演示了标签编码,适用于基于树的模型。一个基于70/30分割训练的随机森林模型AUC约为0.65——“虽然不算出色,但证明了这些特征具有预测力,”世良指出。

学生随后学习如何通过特征工程提高性能,例如创建新的变量,如贷款金额与收入的比率(还款负担)或产品价格与贷款金额的比率(自筹资金比率)。这些变化可以提高AUC分数——有时仅提高0.5个百分点,但这一差距可能对排行榜排名产生重大影响。其他技巧包括将个人贷款金额与组平均值进行比较、尝试不同的编码或填补策略、调整超参数,甚至更换算法。这种“假设—测试—优化”的迭代过程是许多学习者上瘾的原因。

让青少年保持热情的原因,讲师们说,是即时反馈和发现的乐趣。只需几行Python代码,初学者就能建立一个具有竞争力的模型,而一次可视化就能改变他们对数据的理解。“你不需要掌握每一个算法才能开始,”世良说。“重要的是严格的分析、周到的特征设计和不断的迭代。”

GCI的成功反映了更广泛的趋势:数据科学已成为通往人工智能的门户。通过教授预测建模、公平评估和细致的数据准备等核心技能,这门课程使AI更易理解并建立了实际基础。对于企业来说,信息类似:与其追逐流行词汇,不如从分析现有数据、提出正确问题并让证据引导战略开始。

Source: テレ東BIZ

News On Japan
MEDIA CHANNELS
         

Image of NTT推出第二代生成式人工智能 Tsuzumi2

NTT推出第二代生成式人工智能 Tsuzumi2

NTT于10月20日宣布,已正式推出其自主开发的第二代生成式大型语言模型(LLM)“tsuzumi2”。这款新模型在金融、医疗和地方政府管理等高需求领域的专业能力得到了加强。

Image of 东京警方将推出AI警察岗亭

东京警方将推出AI警察岗亭

东京都警视厅计划从明年三月起,在江东区有明地区启用无人“巡逻站”,旨在建立一个新的据点以维护当地社区的安全。

Image of 日本以人工智能训练机器人展望未来

日本以人工智能训练机器人展望未来

日本政府目前正在考虑到2030年开发能够承担此类角色的人形机器,因为人工智能的突破使机器人能够在虚拟环境中经历多年加速学习,掌握动作、反应和适应能力,从而无需依赖摄像头或传感器也能在不可预测的现实环境中运作。

Image of 丰田员工在织城试行人工智能生活

丰田员工在织城试行人工智能生活

丰田于9月25日在其名为“Woven City”的实验城市项目中启动了示范性试验,数个员工家庭搬入其中,以测试人工智能和自动驾驶技术如何融入日常生活。

Image of 小学引入AI练习

小学引入AI练习

过去孩子们使用纸质的汉字或数学练习册学习,但如今课堂正在引入最先进的技术——基于AI的学习练习。

Image of AI俳句应用为诗歌爱好者带来新灵感

AI俳句应用为诗歌爱好者带来新灵感

在福冈市的福冈工业大学举办了一场实验性活动,向参与者介绍了一种独特的AI俳句体验,大家在活动中试用了一个能够审阅并润色原创诗作的应用程序。

Image of 人工智能成为可信赖的伙伴 但存在被滥用和依赖的风险

人工智能成为可信赖的伙伴 但存在被滥用和依赖的风险

人工智能不再仅仅被视为一种工具,而是越来越多地被当作日常生活中的伙伴。AI 的快速发展使越来越多的用户与对话系统建立了情感联系。

Image of 日本企业适应人工智能广告革命

日本企业适应人工智能广告革命

作为日本最大的互联网广告代理商,CyberAgent 在截至2025年9月的财年第三季度业绩中(于8月公布)报告收入和利润同比下降。收入下滑在广告行业并不常见,这凸显出公司正处于一个转折点。

Image of 东京发布富士山喷发影响的AI视频

东京发布富士山喷发影响的AI视频

东京首次发布了一段由计算机生成的视频,模拟富士山大规模喷发可能带来的影响,展示了火山灰如何使首都的功能陷入瘫痪。

Image of 日本日益扩大的数字赤字笼罩生成式AI热潮

日本日益扩大的数字赤字笼罩生成式AI热潮

日本的数字经济正面临日益严峻的挑战:由于云服务和生成式AI的迅猛发展,数字贸易赤字已超过7万亿日元。日常在电脑和智能手机上使用的软件和云端工具大多来自海外科技巨头,尤其是总部位于美国的公司。

Image of 日本通过首部促进人工智能的法律

日本通过首部促进人工智能的法律

日本首部专门针对人工智能的法律已由国会上议院通过,并于五月正式生效,该法被称为《人工智能促进法》。

Image of 日本光学与人工智能技术引领打击假药的战斗

日本光学与人工智能技术引领打击假药的战斗

随着假冒药品在全球范围内持续扩散,日本的光学和人工智能技术正在发挥关键作用,保护人们的生命。

Image of Solaria Plaza 配备 AI 时尚顾问重新开业

Solaria Plaza 配备 AI 时尚顾问重新开业

作为天神 Big Bang 重建项目的一部分,福冈天神地区正涌现出一波新的商业空间。为迎接这一潮流,Solaria Plaza 正在进行约十年来的首次大型翻新,以吸引更多顾客。

Image of AI 是新闻的未来吗?

AI 是新闻的未来吗?

在本月于上海举行的亚洲最大消费电子展上,从机器人到电视机,再到冰箱,"AI"三个字母无处不在。今年的展会几乎完全被人工智能主导,这股浪潮也开始影响媒体行业。

Image of 福冈巨蛋启用AI智能商店

福冈巨蛋启用AI智能商店

福冈软银鹰队的主场——Mizuho PayPay Dome本赛季将迎来一家新型商店:这是一家无需收银的“智能商店”,顾客可以无需在收银台排队即可完成购物。

Image of 社交媒体发布带来隐私风险——‘身份识别服务’的兴起

社交媒体发布带来隐私风险——‘身份识别服务’的兴起

在网上个人信息被曝光的风险几乎是所有人都面临的问题。调查发现,即使是一张看似无害的照片也可能隐藏风险,并且有人将“身份识别”作为职业。