这是一篇由格灵创始人曹宇鹏先生于2022年撰文分享的其对中国AI分级阅读的深入探索,阐述了其重要意义和价值。

原文链接:
https://mp.weixin.qq.com/s/JPKBzDIxi_NjZaOLVZ0IWw/
https://www.fengedu.com/newsinfo/2527879.html/

2022年,格灵阅读平台1岁半,在过去的600个日夜,一共完成了2382次更新:

  • 学生桌面端、web端更新了180个版本
  • 学生小程序端更新了139个版本
  • 教育管理桌面端、web端更新了35个大版本
  • 研发出版了12本分级阅读纸质和数字图书
  • 旗下创作平台产出内容超53000

为超过100所签约公立小学提供了整校阅读能力测评朗读能力测评日常阅读朗读提升等SaaS产品服务,被各学校灵活应用于阶段检测、日常教学辅助、家庭阅读、校内课后服务、自适应学习、个性化作业设计等个性化场景。

通过"线上自适应AI测评+实时大数据反馈+数据解读报告",格灵阅读帮助数个区域教育局系统完成了区域内小学生阅读能力统测教育质量监测与评估工作,为"双减"后的工作开展贡献了优秀实践方案。

超过10万学生在格灵阅读中完成了超过1500万次的阅读、朗读测评和练习。

背后有长达8年的思考和实践。

正文共: 7990字 20图 预计阅读时间: 20分钟

1. 初心与目标

阅读是国家战略,孩子们的阅读能力是一个国家的核心竞争力。

全球有100多个国家和地区参加 PIRLS(全国学生阅读能力进展研究)和PISA(全球学生评估计划)的学生阅读素养、能力进展评估项目。

这个评估排名被OECD(经合组织)和UNICEF(联合国儿童基金会)称为"全球教育排名",评估关注学生在社会生活中各方面素养的发展情况,展望他们将所学到的东西迁移到其他领域以及在新的情境中应用他们学到的东西的程度,而非知识掌握情况,简单来讲就是"预测未来",故被视为"国家发展收入水平和未来发展收入水平排名"的重要依据。

PISA认为,阅读素养、数学素养、科学素养能够决定学生是否掌握参与今后社会生活所需要的"问题解决能力"和"终身学习能力"。

格灵的阅读能力测评曾接受地方教委专家实地测评研究对比,验证与学生的学业水平表现吻合度超过85%

为什么阅读测评会与学业水平表现有这么高的吻合度?

几乎所有学科都需要通过阅读来学习,阅读是教育的核心。

PIRLS认为,小学阶段不但是"学习阅读"的阶段,更是学生从"学习阅读""通过阅读去学习"转变的阶段,这已成为全球教育的共识。

"邓宁-克鲁格效应(达克效应 D-K effect)"向我们阐释了人的一生不断成长的答案,而阅读能力和通过阅读去获取知识的能力是伴随我们一生成长的"底层能力"。举个例子,我们每天都会面对庞杂多样的信息,为什么对同一信息同一内容会表现出不同反馈,甚至会意见相左针锋相对,这种现象时时刻刻都在发生,其实是阅读理解、思维思考、知识经验、认知水平、知识表达的差异。

"书读百遍,其义自见"是真的吗?

对于大多数人而言,这并非事实。虽然近年来"书香社会"、"书香校园"的推广和建设,社会和校园的读书环境改善了很多,每年不乏各种"推荐书单"传递到家长手中,中国孩子的阅读量着实有了明显提高。但阅读问题依旧是老师、家长和学生遇到的头号难题。

在近几年的双11、12购物节,小学语文阅读练习类教辅总是牢牢霸占教辅销量榜前10名超过2/3的席位,家长反馈,都说阅读重要,老师也要求阅读,就是没有引导怎么去阅读。

《论语》有言"学而不思则罔,思而不学则殆。"朱永新说:"我们常常关注读什么书,却容易忽视怎么读。"

读书在于理解、思考、感悟、运用。

对大多数孩子来讲,多数是自己读不懂书的,"书读百遍,其义自见"并不适合他们中的大部分人。"书读百遍,其义自见"的前提是先掌握适合的阅读方法

这些年我们深入一线,帮助很多学校开展了很多测评,每次都会和可爱的孩子们先进行面对面的交流,与孩子们谈谈心,这是我们最喜欢的事情,与我交流的孩子中向我炫耀自己"读书量年过百本"的就有不少,那得意的样子历历在目,读书真的带给他们快乐了吗?谈到困扰他们的阅读问题也是各种各样、学习成绩上没反馈,还有无助失去兴趣的,一个个谈起来好像一箩筐都说不完。

格灵阅读的数据发现

在中国数十万组测试数据中发现:同班同学间,孩子们的阅读能力均有着极大的差异。有的3年级达到了4、5年级高级水平,有的3年级还在2年级低级水平。尤其在各地生源更加复杂的学校,班级内学生能力的差异会更加明显。

"内卷"的根源与"强省会"战略的阵痛

"内卷" 底层根源是愈发突出的"教育均衡、教育公平"矛盾。长久以来"义务教育均衡发展" 变成了"竞争式淘汰式教育",成了起跑线上的竞争、资源的竞争、扼杀不同、扼杀个性的竞争、卷分数线的竞争,导致顶部越来越卷,与底部差距越拉越大,社会矛盾越来越突出。

城市化进程中"强省会战略"加速了人口、人才由农村→城镇→省会→一线→超一线的逐级递进,资源的虹吸影响等所带来的问题也放大了顶部和底部的问题和焦虑。城市间、城乡间、地域间的发展和教育环境、教育资源配比本就存在差异,这种差异随之被放大了。

长期"内卷"的危害无疑是毁灭性的,教育本就应该是多元发展、挖掘个性、培养兴趣、释放潜能、自我比较成长的教育,而如果先扣一个"竞争式淘汰"的命题,那一切都会成为理所应当,大家一起朝着一个方向卷出天际。最优质的头部卷完分数,卷"十项全能",中部不断卷"分数线",底部人生落差越来越大,选择躺平或被躺平,人生很小就被定性。如今内卷造成的焦虑已经从孩子"出生"前就开始存在,"一出生"就站在了起跑线,面对着地域歧视、阶层歧视、择校歧视。

如何应对内卷?

首先要正确认识学生个体的差异性,要尊重差异,需要差异化培养的方法,而非去除差异化。

实现"因材施教"的个性化培养是教育的根本,"因材施教"是从孔子时代就开始努力的事情,但在班级人数多、学习节奏相对固定的中国校内"大班课"教育场景下,想要发现和照顾到每一个孩子的个性化问题和发展,在过去是非常难的。

"双减"的指导

"双减"对教学创新,"因材施教"给出了明确指导,旨在将教育回归到校内,重新定义教育的考核评价标准和人才培养选拔方向。

现代教育跑了200多年,人的认知观念是最难改变的东西,如果能够短时间有所改变,那么必须整个教育体制和选拔出口先发生改变

于是双减来了。

双减减去了K12阶段所有的学科校外培训,减去了传统的课业负担,甚至是传统的课业方式,将教育回归到校内,从这里大家重新起跑,进行一场全新的探索,学什么,培养什么,该怎么培养,学习培养的目标,教育的考核评价标准、人才培养选拔方向都将被重新定义,完全是颠覆式的一场教育变革,也许"双减"后的教育,将是历史以来最接近实现因材施教个性化教育的一次,也许我们将迎来"百花齐放"的下一代。

同时,从政策上可以看到国家希望的科技力量与教育结合的正确打开方式,如应用人工智能和信息技术,在差异化教学,分层教学、促进学生个性和潜能发展、教学考试诊断评价、学情数据采集分析、个性化教育方式、个性化作业设计等方面,对于学校,对于每一个老师都是一场全新的、艰巨的又不熟悉的挑战。

格灵阅读用了8年时间在"阅读上实现因材施教",希望让每个孩子掌握"通过阅读去获取知识"的能力,实现千人千面差异化的自我成长。

2. 不积跬步无以至千里

没有事情是一蹴而就,8年后,我们的理解更通透了。

实现阅读的因材施教,需要先建好地基,需要先制定学生阅读能力、阅读内容难度的分级、定级、评价标准,而在中国这是一件空白的、全新的、门槛非常高的事情。

"中文分级阅读"的现状

"分级阅读"概念因《牛津树》、《迪士尼》、《培生》等英文产品畅销而得到认可,其背后是40多年的发展实践。而"中文分级阅读"却几近空白。

实际上在中国,中文阅读一直从属于语文教育的发展经历了并不短暂的5个发展时期。只是近几年才开始促进"阅读"超越"语文"学科,实践"跨学科阅读教学"。

关于中文阅读和中文分级阅读的前世今生故事过于专业硬核,我们在此篇文章不做进一步展开。"中文分级阅读"与"英文分级阅读"发展阶段可以简单通过一张图来了解。

目前市面上中文分级阅读的三种理念形态

英文的蓝思、AR、GEL、DRA均已完成了对阅读能力和读者阅读能力的分级和匹配,这一点是分级阅读的意义所在,应用最广的是蓝思,实践结合最好的是AR。

而目前市面上大多数中文分级阅读都是伪分级阅读,中文分级阅读目前在国内我总结为三种理念形态:

  1. 分年龄阅读
  2. 分年级阅读
  3. AI分级阅读/能力分级阅读(真正意义上的分级阅读)

分年龄阅读和分年级阅读其实只完成了对内容读物的单方面分级,而读者阅读能力则是开盲盒。我们知道在同年级同年龄的孩子阅读能力差异是非常大的,所以它们实际是过去"推荐书单"的新瓶装老酒

实现第3种借助AI的能力分级阅读则是真正意义上的分级阅读,需要对阅读能力和内容难度分别进行分级,并通过技术手段进行匹配,但也是门槛最高的。

研发中文分级阅读的门槛

  1. 需要非常了解前沿国际分级阅读体系和教育体系发展又有丰富的国内一线语文教学研究发展的教研人员
  2. 需要既能指导配合老师完成教育知识体系技术转化又能掌握前沿技术应用的高级开发者
  3. 需要深具互联网与教育融合基因的团队构成
  4. 首先要完成大量的用户看不到的基础学术研究和成果整合、完成庞大的知识体系建设、业务系统、AI系统等基础研发
  5. 然后再构建用户所使用的上层业务,应用到产品中接受市场检验与数据反馈进行不断打磨

这种复合型具备科研和实践能力的人本就凤毛麟角,在这样深具互联网与教育融合基因的团队构成下,相比成熟领域快速打造一款产品多了太多的部分和时间成本,这是一件投入非常高、费时费力、成效慢、非常难,高门槛但有意义的事情。

"格灵智能中文分级阅读标准体系"诞生

格灵阅读团队有团队有着超过13年的互联网和教育领域的产品实践积累,但也花费了5年多时间才初步攻克了"中文阅读能力分级、阅读内容分级、定级、评价标准"这一门槛,在5年间有数十位热衷并推动此领域研究的权威专家学者、大学教授、一线特高级教师、教材出版团队支持并参与其中。

  • 融合了格灵的"阅读能力评价框架"、"语文阅读素养体系"、"认知分级评定体系"、"教材知识评定体系"的分项成果
  • 结合了蓝思、AR、美国CCSS、PIRLS与PISA等国际体系的先进经验。
  • 基于AI深度学习技术对阅读能力和阅读内容进行了精准分级,由低到高分为36级,难度范围从 CGR1 - CGR5100,代表着阅读能力水平及整本书到单篇文章的难度,每个等级都与知识体系、年级学业水平、各阶段阅读能力指标、阅读成长路径、教学目标等相对应,用阅读能力等级评价代替传统单维分数制
  • 该体系获得了2021中国教育博览会创新精品成果。

"格灵阅读能力分级量化评价框架"诞生

前面我们讲到对大多数孩子来讲"书读百遍,其义自见"的前提是先掌握适合的阅读方法,应对学生间学习和阅读水平的差异化难题的方法是通过差异化培养方法。

"格灵阅读能力分级量化评价框架"

  • 对"阅读素养"和"阅读素养培养目标"进行了明晰的陈述,将教材课标的知识体系、PISA阅读素养评估框架、PIRLS阅读能力评估体系完全融合,做了更深层的颗粒化工作,涉及语言基础知识、单篇阅读、整本书阅读。
  • 涵盖 7大能力(基础知识、信息提取、联系推论、分析概括、领悟体会、鉴赏评价、创造运用)、28个子能力方法
  • 按基础、低阶、中阶、高阶进行能力分层和目标分层,引导学生在阅读中锻炼并掌握各种阅读能力、阅读方法,引导学生完成从"学习阅读"到"通过阅读去学习"的转变。

"格灵阅读测评"诞生

  • 基于"格灵智能中文分级阅读标准与评价体系"、格灵阅读能力分级量化评价框架
  • 融合了AI千人千面的阅读、朗读测评诊断数十项实时分析数据反馈AI与专家分析诊断报告、蓝皮书服务功能相结合。
  • 融入了国际最前沿的评价方法"增值性评价",更注重对个体学生自我成长变化的关注和进步。
  • 一年内取得了百所学校深度使用,经过地方教委教研检验。

日常应用:

  • 老师可通过"格灵教育管理平台"发布阅读、朗读、综合任务。
  • 学生可根据自身情况选择任务强度,系统会根据阅读水平和数据匹配适合的内容。

图书出版:

  • 汲取10多年西师版《语文》教科书编写经验,结合"格灵智能中文分级阅读标准体系",研发出版了小学1-6年级的分级阅读纸质图书,与部编语文教材精准匹配。

阅读测评这件事,格灵是中国版的RENISSANCE吗?

在起初,有人问格灵阅读是否是中国版的RENISSANCE?

在国际基础教育测评领域,"阅读"早已成为专项测评。比如全美22个州3500万学生用蓝思分值来衡量自己的阅读能力,每学年有超过4500万份的阅读测试题在RENISSANCE上被学生完成,平均每天有超过190万个阅读理解练习题被完成,RENISSANCE数据库中储存了超过35000个美国学校1070万学生的阅读记录。

中国国内大部分阅读能力测评都作为产品之中的精小的特色功能存在,还处于非专业水平,往往通过5-10分钟的简易测试得到一个建议结果,来为后端付费业务(如图书推荐售卖、课程推荐售卖)服务

得益于格灵中文分级阅读标准评价体系的基础工作建设,得以结合AI等技术手段,实现技术手段的阅读内容分级,阅读能力分级,得以实现更精准的大规模阅读测评,使格灵阅读测评成为现实。

3. 高筑墙,广积粮,终有收获

要做难而正确的事,做长期而有意义的事。

余华在小说《兄弟》中有这样一句话:"写作就是这样奇妙,从狭窄开始往往写出宽广,从宽广开始反而写出狭窄。"创业也是同样,选择一条看起来宽广又没有门槛的事,走着走着就会走投无路。要做难而正确的事,做长期而有意义的事。

除了长达5年构建了"格灵智能中文分级阅读标准体系",格灵阅读还打造了三项领先核心技术

核心技术 描述
千人千面的阅读测评 AI系统实时根据学生过程表现,调整即将出现的内容、难度、能力点,实现个性化测评。
智能匹配适合难度的内容 采用AI技术机器学习算法,通过字、词、句、段、篇章五个维度定义内容难度分级,实现对整本图书、阅读材料、朗读材料较为精准的难度测量。
音素级儿童朗读测评 AI智能语音评测,独有的儿童朗读优化标准和算法、长文本、多音字语音识别纠错,可针对字词、句、段进行流利、完整、正确、发音、漏读、情感等多维精准判分。

4. "流动的中国"和公益行动

"留守儿童"与"流动儿童":

我国民政部2018年曾经发布统计,10年间我国的留守儿童数量,从5800万减少至697万,而我国大学教授学者统计的留守儿童数据为6000到 6700万,什么才是真实的数据呢?

其实我国政府数据统计口径为儿童上限年龄是16岁,同时父母双方必须同时不在孩子身边,并且是孩子在农村老家没有监护人,这才叫留守儿童。而我国学者统计的口径是儿童上限年龄是18岁,这孩子父母双方有一方不在孩子身边,就归于留守儿童,所以才会有如此巨大的差异。

并且随着城市化的进程,大约还有3000多万的儿童他们的父母在"北上广深"等一线城市工作,他们叫做"流动儿童",这样"留守儿童"+"流动儿童"总量实际是超过1亿"的,在我国城市化进程的过程中,这1亿大约是1/3的学龄儿童处于留守或流动的状态

格灵一直在关注这个群体的成长,从2019年开始格灵阅读与中国福利基金会、叶柏阅读公益基金会、儿童救助基金会、社会组织和文化教育部门和地方爱心合作伙伴一直在积极帮助和改善偏远落后地区的儿童,为他们提供救助金、图书、生活、学习与心理健康上的帮助,也一直在思考如何让高科技产品不再高高在上,遥不可及,可以帮助到这些最需要帮助的儿童。

阅读是这个世界最低成本获得最大收益的方式,也是让自己变得更厉害成本最低的方式。

有人说这个时代让孩子的起点差异越来越大,未来圈层越来越难被打破,寒门再难出贵子,哈佛的教授在《Our Kids: The American Dream in Crisis》讲述了美国贫富孩子之间的差异,谈到穷人的孩子缺少生活中的榜样,父母很难给出思维或者处事上的好建议,也缺乏足够的教育投入,单亲陪伴的成长环境更加剧了孩子没有一个完整的成长环境和思维观念的问题。

阅读是这个世界最低成本获得最大收益的方式,也是让自己变得更厉害成本最低的方式,阅读让孩子获得生活的榜样,可以站在巨人的肩膀上,突破认知,是所有儿童都可以无任何障碍享用的东西。

5. 不忘初心,砥砺前行

2022年格灵阅读将迎来重大新版本升级上线,将继续加强中文分级标准体系的研究建设和优化完善,加强阅读测评等现有核心业务的功能更新和改进,并对"创作平台"进行大的升级,现有的"创作者联盟的线下创作机制"转入线上,同时在跨学科阅读上继续探索,加强与合作伙伴们的合力,加强对学校和教育部门的服务配合,努力参与公益行动,做阅读与儿童、教育与个体、学校和家庭,老师和学生间的"连接器",努力帮助每个孩子掌握"通过阅读去获取知识"的能力,实现千人千面差异化的自我成长,帮助学校教育实现"因材施教"个性化培养的突破,实现"阅读上的因材施教"。

我们深信 "每一个孩子都是一粒种子,只是花期不同"。

怀揣梦想,砥砺前行!


原创声明: 本文中内容涉及格灵阅读知识产权,不得用于商业行为,商业合作请联系本公司或作者,转载本文或转载本文中内容请注明出处。

标签: 中国教育 (1) 教育评价 (4) 分级阅读 (7) 人工智能 (6)