一路阳光/转帖

浅谈高考志愿填报院校录取线和专业录取线的预测

作者:肖爱民 高考志愿填报赤峰工作室

一、写在前面

如何精准定位高考志愿填报方案?那就是用数学的方法预测院校的录取线和专业的录取线。实际就是对历年的录取数据和当年的招生计划等信息进行整理分析,找出规律所在。

在上个世纪,我为考生参谋志愿,都是靠碎片化的数据信息,这样搞了几年,开始意识到这样进行填报指导完全是凭感觉,其精准性大打折扣。要想做到准确定位,就必须要有确切的数据做参考,并用数学的方法加以统计分析,这样的参照系才会有更可靠的准确度。这个数学方法就是要建立数学模型。什么是数学模型?这个数学模型不是简单地一加一减的算术,而是建立找出院校和专业录取规律的抽象的简化的等式或对应关系,以及图表图象等描述考生成绩分布规律和招生人数变化的数学结构表达式。这个表达式实际就是一个方程式。


高考志愿填报专业录取分数线参考(浅谈高考志愿填报院校录取线和专业录取线的预测)(1)

从2003年我就全面地开始搜集有关数据,建立了数学模型,并加以整理分析。通过对这些基础数据的研究,我总结了一套切实可行的数据处理的理念和方法,使我对高考志愿填报更加得心应手,目标院校和目标专业填报的精准度尽在掌控之中。

大家知道,就高报这一行业来说,最原始的焦点是什么?那就是保证考生不滑档。现在的大平行志愿填报模式成全了我们,滑档已经是小概率的事件。以一个省的志愿填报是以6所院校,每所院校可选6个专业为例,虽然说大平行的填报模式使各院校录取的分数出现扁平化,但还是有20到30分的分数区间差。若我们把每所院校的录取分数区间看成是一个小区间,把6所院校的并集看成是一个大区间,那么,这个大区间会有多大的分数区间差?可能是40分、50分、60分甚至会更多。用这么大的一个区间去套能否被录取的一个点,这个点落在区间外部的概率太小了!所以,现在保证不滑档已不是最突出的问题。

当前高报行业突出的问题应该在于:如何做到根据考生和家长的诉求实现目标院校和专业精准定位的问题。如果考生选择专业已定,如何保证考生的专业方向不被调剂的录取?如何做到对专业优先的考生实现“三个一”(即第一所院校的第一个专业录取,被录取的专业排名不是第一名,只招一人的专业除外)的目标?让我们百分之百的做到不可能,那是强人所难。那么能否做到80%、70%或是60%的考生实现专业优先的定位,做到实现“三个一”呢?新高考,新在哪儿?我感觉很关键的一点就是由原来院校 专业的大平行录取模式改为专业 院校的新高考录取模式,这种录取模式并不是一个简单地调个,其实是谁优先的问题。

最近几年,在给内蒙古、河南、河北、湖北的一些机构或独立咨询师讲课时,讲的重点议题就是对数据进行处理和分析。他们深刻体会到这样处理的数据,使用起来优点就是十个字:“全面、直观、快捷、准确、实用”。这样处理的数据用于新高考的志愿填报,将会使志愿填报方案的设计更加简单化,做到省时、省事、省力。

在设计高考志愿填报方案时,必须要掌握完整的数据。不全的数据可能对指导多数人没有太大的影响,只会对少部分考生有影响,好像无关大局,但是对个别考生来说那就是100%,可能就会影响他的一生。例如:2015年内蒙古已将二、三本合并,一本的最低控制分数线是464分,合并后二本的最低控制分数线是336分。当年我指导一位高考总分是366分的理科考生,家长和考生就想学土木工程专业,最大的期望就是走公立并且不是高收费的院校。而在当年,内蒙古新增加了一所院校,叫鄂尔多斯应用技术学院,是2015年4月经教育部批准成立的公立二本院校。我经过测算后,确定考生重点关注该所院校的土木工程专业,最终被顺利录取。这个专业的录取分数区间是[387,366],该专业共计招生66人,他专业排名为第66名。报考完后,他的家长问我,肖老师你怎么知道有这所院校并且我的孩子能被保专业的录取?我的回答就是:我靠的就是全面详实的数据。

一份数据是否全面详实完整,只告诉大家一个最直观,最简单的检验办法。一是在本省的招生计划出来时,看他的数据里有没有当年各院校所有专业的招生计划和当年新的备注说明。没有当年各院校所有专业招生计划的数据是一个不完整的数据,也是一个利用价值很低的数据;没有当年新的备注说明,是一个极容易造成考生被退档的数据。二是找一个当年在本省新招生的院校和专业,看他的数据能否提供有价值的参考,若没有,那么这个数据就不能提供全方位的指导。三是看是否有本省特殊的招生类型的数据。例如:河南省的数据看一下有没有河南科技大学与三门峡市政府联合办的应用工程学院的数据。

每年都会有考生和家长看了我数据后说,我就想找这样的数据,查了很多卡,都没有老师您这样的数据,老师你把它公开不是更好吗!我说,这是我的心血!毫不夸张的说,若把我处理完的数据向考生和家长公开,考生能走那所院校的那个专业一眼就能看出来。2012年有一位考生和家长来找我咨询,考生的成绩是551分。她的父亲为孩子的报考花费了半年的心血,打印的资料有半米高。家长让我看他的资料,我简单说了不用看的理由。我说:高考志愿填报不是哪所大学好哪所大学不好我知道你不知道的问题,现在的信息手段这么发达,这些在网上一查就能了解的信息,不用我说谁都会知道。而我们进行志愿填报最最关键的问题就是如何找准自己的位置。形象的说,你高考考多少分,就相当于你值多少钱,应该卖到哪儿块去的问题。应该在适合考生的院校和专业当中来选择相对理想的院校和专业。我要求家长按我的咨询流程进行,当进行到半个小时时,我中途准备出去交代一件事情,这位家长跟我说,肖老师,我看看你的数据可以吗?我说可以,但是不能拍照,给你10分钟时间浏览。待我返回后,这位家长说,肖老师我服了,看来我搞的这些资料大多对我的孩子都是没有用的,你的数据太全了,太有说服力了,一目了然。肖老师,你说吧,孩子的志愿怎么填报一切听你的。

现实地说,我们在为考生填报志愿服务时所面临的最直接的问题就是:考生的分数已定,专业方向确定,在保证考生分数利益最大化的前提下如何来实现考生的专业意向、院校意向和地域意向。在近几年高考志愿填报时大家都有一种感觉,现在的家长和考生难伺候了,挑剔太大了。随着时间的推移,这种现象还会越来越严重。现在已不是“划拉到筐子就是菜”“有书念就可以”的时期了。这是考生和家长的认知水平提高的具体表现。大家都明白了专业决定着职业,决定着今后就业的领域。很多单位在选人用人时都要看你是什么专业毕业的,也就是我们常说的“科班”出身。所以,考生和家长越来越认可“专业优先”的填报方式。例如:考生要求非“临床医学”不学,非“自动化”不学等现象,致使考生被录取的范围越来越窄,发生专业被调剂或滑档的可能性会增加。

那么,在志愿填报服务时如何来实现考生的目标呢?“工欲善其事,必先利其器”,我们在为考生准确定位时不能靠感觉,一定要有数据支撑,一定要用数据说话。这就要求我们手中要有与之相适应的“利器”,——全面详实准确的和可操作的数据。

二、数据处理的基本做法

(一)必备的基础数据资料

1、历史基础数据资料应有:院校的招生计划和分专业的招生计划、一分一段表、各批次的最低控制分数线、院校的投档分数线、各院校录取的最高分最低分及录取人数、院校各专业录取的最高分平均分最低分及录取人数等相关数据资料。

2、当年的数据资料应有:院校的招生计划和分专业的招生计划、一分一段表、各批次的最低控制分数线等资料。还应有明确的备注。具体应包括:院校的层次、性质、地域、专业报考对身体的要求、小分的要求、加试的要求、录取规则、大类招生的专业说明、办学模式、办学地点、收费标准等等。实际就是“大厚本”的内容和我们整理的限制要求等内容。

上述所说的数据都是可加工分析处理的电子版数据。

(二)数据的处理与分析

这些数据都是各自独立的,我们要将这些数据进行统计处理,将它们变成为我所用的综合数据。那么,这些具体的数据资料对我们进行统计分析都各自有何作用呢?

1、 一分一段表 历年的一分一段表实际都是关于分数与位次的二元函数,其图像都是近似一条曳物线。我们把这些相关联的二元函数进行对比分析,实际就是解一个二元方程。这个二元方程从建立到解出是很麻烦的,我们实际运作时完全可以用直观的图像法进行对比分析。找出变化趋势和特殊点(拐点或回归点),就可以找出不同年份之间的变化规律,确定出变化区间和修正值。这是对等效分的一次修正。

为什么要有这样的分析呢?因为考生的分数不同所处的位次就会不同,还有就是每一分的分数区间分布的人数也会不相同。以河北省理科为例,2018年446分的考生有700人,累计位次是128152;而对应的2019年累计位次128172有904人,分数是458分。如果简单的将2019年458分的等效分视为2018年的446分,这就会出现很大的偏差,因为在这个位次上考生人数出现的频率是不一样的,相差204人。这时就需要根据考生人数出现的频率变化对等效分加以修正。

2、院校录取的最高分最低分及录取人数和当年对应院校的招生计划 每个院校录取的分数区间实际上都是一个置信区间,这个置信区间是由院校的冷热程度、专业的冷热程度、地域的冷热程度及招生人数的多少来决定的。我们通过对这些区间分布的分析,特别是对各院校招生人数的分析即可找出修正值。这是对等效分的二次修正。

假如:清华大学在本省本科一批理科的招生计划是100人,一位理科考生在全省的排名是95名,那么这位考生想去清华大学能否走成?回答是肯定的。若清华大学在本省本科一批理科的招生计划是70人,一位理科考生在全省的排名是95名,这位考生想去清华大学能否走成?一定会存在疑问。我们就应该用这种数学的思维方式、方法来进行修正。

3、专业录取的最高分平均分最低分及招生人数 把每一所院校这些具体的数据,都看成是一个集合里的不同元素,并把它们进行统计排列,都会组成一个类似的对角线矩阵。这个矩阵体现着这所院校具体专业录取考生成绩的分布走势,这个走势将进一步修正该院校各专业的录取分数。同时,这个矩阵将决定着做方案时对院校的取舍和专业的取舍。这是对等效分的第三次修正。

4、当年的数据 主要就是“大厚本”的所有内容和当年的录取规则及限制要求等。我们应该将当年的招生计划及备注等内容整理成我们使用的数据,便于我们逐条的进行分析,有利于精准定位的设计高考志愿填报方案。有这些具体的数据信息,在做方案时,还能有效地避免因小分不符、身体条件不符、加试不符合要求等因素而造成退档的现象。绝对不能出现提供的方案是上年的信息而今年没招的笑话。

5、数据的合成与测算 把历史数据与当年的数据进行合成,并利用一次修正值、二次修正值、三次修正值和矩阵里各元素的排列规律,对当年各院校的录取线和各专业的录取线进行预测,得出了经过初步整理的源数据表。

6、对源数据表进行综合分析处理 将源数据表所有的招生院校和专业都进行对比分析,并按我们制作高考志愿填报方案所需的要求进行整理,最终实现所有历史的和当年的数据信息都在我们的掌控之中,全面准确,一目了然。在设计高考志愿填报方案时抛弃“大厚本”。我每年拿到“大厚本”都是在处理数据时使用,当我把数据处理完,“大厚本”就被束之高阁了。有这样一份全面的、详实的、可操作的数据,就能做到设计方案时准确、快速、完整,都会对涉及到的院校和专业的数据逐条分析,不遗漏任何对考生有用的信息,规避所有对考生不利的信息,有效地提高工作效率,极大地提高目标志愿的录取概率。

为啥特别强调数据要全面、详实、准确呢?

在这里我以2019年理科一批为例,举几个省的数据。

内蒙古的本科一批理科2019年的数据大约有3869条,其中有历史数据做参考的3127条,2019年新增的数据742条。这742条有的是院校和专业都是新增的,有的是院校招生类型发生变化的,有的是院校没变,但是专业是新增的。新增的数据占总数据条数的19%。

河南省的本科一批理科2019年的数据大约有8150条。其中有历史数据做参考的6733条,2019年新增的数据1417条。新增的数据占总数据条数的17%。

河北省的本科一批理科2019年的数据大约有7596条。其中有历史数据做参考的6445条,2019年新增的数据1151条。新增的数据占总数据条数的15%。

这些有变化或新增的数据信息,已经占了1/6。只有全面的掌控这些数据,才能在制作方案时不出现遗漏,做到给考生精准定位,突出个性化的设计。

一份完整的高考志愿填报方案包含的内容应有:当年招生院校的代号、院校名称、院校的招生计划、专业代号、专业名称、专业的招生计划、招生专业的备注(包括专业报考的身体要求,小分要求,加试要求、录取规则、大类招生的专业说明、办学模式、办学地点、收费标准等说明);还要有历史的对应数据(包括历史的院校招生计划、专业的招生计划、专业录取的最高分、最低分、平均分等信息)。

综上,是我从事高报若干年处理数据时的一点心得体会,不对的地方请各位批评指正。谢谢大家。

,