我们经常可以看到各种各样的英语词汇量测试功能,你测试过吗?你觉得准吗?
我使用过有道词典的词汇量测试功能,我认为它最大的问题是,不管是谁不管测多少次,每次测的词都是固定不变的,这就好像高考,全国各地年复一年都考同一套题。
当然,它是怎么来评估词汇量,使用什么算法,那就更不知道了。
本文提出了一种使用随机抽样梯度下降算法来预估词汇量的方法,经大量用户反映,很准,你是不是心动了,想马上试一试呢?立马测试一下吧,使用中文定义 或 使用英文定义。
测完词汇量,我们就来看看如何使用随机抽样梯度下降算法来预估词汇量:
1、将词汇分成9个级别,难度是先递增然后平稳然后稍微有一点下降。
2、从这9个级别中,随机挑选总共100个单词,从第1级到第9级挑选的个数分别是:5、10、15、15、15、10、10、10、10。
3、之所以选择100个单词,是经过精心设计的。正常时间需要8分钟完成,如果高手来做题,应该会在5分钟内完成;如果菜鸟做题,一般会超过16分钟来完成;还有一种情况,就是如果有人闭着眼睛一直选A,这样他大概只要1分钟左右的时间。
4、因为这9个级别总体趋势是梯度上升的,在做题的时候,如果前面的梯度出现问题,那么说明基础不扎实,这虽然不会中断测试也不应该中断测试,但是会减少后面梯度的预估权重。
5、在词汇量预估模型中,使用固定值预估+梯度下降算法来计算。
6、给用户记时,用户答题完成后,计算每一个级别答对的问题数目,如: 1 -> 2,2 -> 3,… ,9 -> 3。
7、计算每一个级别答对的比率 = 每一个级别答对的题数 / 每一个级别总的题数。
8、遍历每一个答对的题,累加预估总词数。如果题目属于第一级, 则将第一级答对的比率乘以固定的预估值作为该题预估词数。如果题目不属于第一级, 则将上一级答对的比率和本级相乘,然后用这个比率乘以固定的预估值作为该题预估词数。如果上一级全部答错, 则将上一级的答对比率固定设置为0.1。
9、加入答题时间的影响。期望答题时间是8分钟。每提前一秒钟预估词数加20,最多加量不超过3600。每落后一秒钟预估词数减20, 最多减量不超过9600。假定做题最快时间不少于4分钟,如果少于四分钟,每少N秒预估词数就减去4800+N*20。
10、如果如上算法最后获得的预估词数是负数,则去除负号取绝对值。
算法实现如下:
1、使用如下代码构造quiz对象,这里我们不但支持中文词典还支持英文词典,进一步参考Quiz类的完整实现:
Dictionary dictionary = WordLinker.getValidDictionary(request.getParameter("dictionary")); Quiz quiz = Quiz.buildQuiz(dictionary);
2、获取quizItem,然后展现给用户,展现页面的JSP代码参考这里,进一步参考QuizItem类的完整实现:
QuizItem quizItem = quiz.getQuizItem();
quiz.step()指示当前测试到第几题了,quizItem.getMeanings()是提供给用户的选项,默认是4个。
3、获取用户答案,将用户答案保存到quiz对象中,返回值表示用户是否答对:
boolean right = quiz.answer(word, answer);
4、当quiz.getQuizItem()的返回值为null的时候,说明题已经答完了,那么就给用户显示结果,告知用户哪些题答对了,哪些题答错了。可通过quiz.getQuizItem()获得所有的题目,并通过quizItem.isRight()来判定是否正确,通过quizItem.getWord().getWord()来获得词,通过quizItem.getWord().getMeaning()来获得所有的选项,通过quizItem.getAnswer()来获取用户提交的答案。
5、调用quiz.getEvaluationCount()为用户计算预估词数,预估词数的代码实现如下:
public int getEvaluationCount(){ //答题完成时间 endQuizTime = System.currentTimeMillis(); //计算每一个级别答对的问题数目 //如: //1 -> 2 //2 -> 3 //... //9 -> 3 Map<Integer, AtomicInteger> levelRightCount = new HashMap<>(); quizItems.stream().forEach(quizItem -> { levelRightCount.putIfAbsent(quizItem.getLevel(), new AtomicInteger()); if(quizItem.isRight()) { levelRightCount.get(quizItem.getLevel()).incrementAndGet(); } }); //预估总词数 AtomicFloat count = new AtomicFloat(); quizItems.stream().filter(quizItem -> quizItem.isRight()).forEach(quizItem -> { //计算每一个级别答对的比率 = 每一个级别答对的题数 / 每一个级别总的题数 float rightRate = levelRightCount.get(quizItem.getLevel()).intValue() / (float)LEVEL_TO_TOTAL_COUNT.get(quizItem.getLevel()); //如果题目属于第一级, 则将第一级答对的比率乘以固定的预估值作为该题预估词数 if(quizItem.getLevel() > 1){ //如果题目不属于第一级, 则将上一级答对的比率和本级相乘 //然后用这个比率乘以固定的预估值作为该题预估词数 int lastLevel = quizItem.getLevel() - 1; float lastRightRate = levelRightCount.get(lastLevel).intValue() / (float)LEVEL_TO_TOTAL_COUNT.get(lastLevel); //如果上一级全部答错, 则将上一级的答对比率固定设置为0.1 if(lastRightRate == 0){ lastRightRate = 0.1f; } rightRate *= lastRightRate; } count.addAndGet(SCALE*rightRate); }); int cost = (480 - (int)(endQuizTime - startQuizTime)/1000) * 20; //期望答题时间是8分钟。每落后一秒钟预估词数减20, 最多减量不超过9600 if(cost < -9600){ cost = -9600; } //期望答题时间是8分钟。每提前一秒钟预估词数加20,最多加量不超过3600 if(cost > 3600){ cost = 3600; } //假定做题最快时间不少于4分钟,如果少于四分钟,每少N秒预估词数就减去4800+N*20 if(cost > 4800){ cost = -cost; } //返回预估值 if((count.intValue() + cost) > 0){ return count.intValue() + cost; } //如果如上算法最后获得的预估词数是负数,则去除负号取绝对值 return - (count.intValue() + cost); }
相关推荐
- **参数估计**:常用的最大似然估计法,结合优化算法如 L-BFGS、随机梯度下降 (SGD) 或 Follow-the-Regularized-Leader (FTRL) 来求解最优参数。 **2. 技术演变与发展** 随着技术的发展,转化预估模型经历了从...
小姐姐炫酷唯美引导页.zip
scratch少儿编程逻辑思维游戏源码-让它们跳起来.zip
少儿编程scratch项目源代码文件案例素材-战斗塔防.zip
前端开发_Vue全家桶_vw适配_vux组件库_mescroll滚动_fastclick优化_mock模拟_less预处理器_移动端脚手架_基于Vue2和Webpack3构建的移动
数据可视化分析_微信小程序开发_JavaScript_Canvas图表渲染_数据助手工具_仿微信小程序数据助手_支持线性图圆环图柱状图条形图_动态效果适配_商业数据分析_移动端数据
少儿编程scratch项目源代码文件案例素材-章鱼怪.zip
音乐流媒体_API开发_网易云音乐接口封装与数据抓取_提供完整的网易云音乐API调用解决方案_包含歌曲搜索_MP3资源获取_歌词解析_播放列表管理_歌手专辑查询_专辑详情展示_MV
物联网与健康监测_基于RISC-V架构ESP32-C3芯片与MAX30102MAX30205传感器_LVGL图形界面与WiFiBLE双模通信的智能手表系统_实时监测心率血氧体温
wangtengfei-hn_EmployeesExample_23540_1745868671962
Android开发_自定义View绘制动画效果_模仿小米手环App首页计步数据展示_实现可自定义目标步数当前步数颜色字体大小圆点尺寸的动态步数统计图表组件_用于健康运动类App展示
少儿编程scratch项目源代码文件案例素材-钻机机器人.zip
scratch少儿编程逻辑思维游戏源码-狂暴坦克.zip
scratch少儿编程逻辑思维游戏源码-拳击.zip
scratch少儿编程逻辑思维游戏源码-魔方冲刺.zip
少儿编程scratch项目源代码文件案例素材-重返危机.zip
杰奇CMS小说网站系统_php53-73_mysql5-MariaDB10_utf8mb4编码_GBK自动转码_INNODB存储引擎_多模块支持_前后台分离_电脑手机双版适配_
linyuan620_StockAnalysisAssistant_17128_1745866117970
本系统采用的数据库是Mysql,使用SpringBoot框架开发,运行环境使用Tomcat服务器,ECLIPSE 是本系统的开发平台。在设计过程中,充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面简洁等特点。
少儿编程scratch项目源代码文件案例素材-足球踩踏者.zip