计算机与现代化

• 网络与通信 • 上一篇    下一篇

基于在线评测数据的题目等级分类模型研究

  

  1. 济南大学信息科学与工程学院,山东济南250022
  • 收稿日期:2016-12-28 出版日期:2017-03-29 发布日期:2017-03-30
  • 作者简介:范玉玲(1976-),女,河北任丘人,济南大学信息科学与工程学院讲师,硕士,研究方向:数据挖掘与信息处理; 徐涛(1979),男,讲师,博士,研究方向:模式识别,图像处理; 王 钦(1980-),女,讲师,硕士,研究方向:数据挖掘与信息处理。
  • 基金资助:
    国家自然科学基金资助项目(61302128); 教育部产学合作协同育人项目(201601023018)

Study on Grade Categorization Model of Question Based on Online Test Data

  1. School of Information Science and Engineering, University of Jinan, Jinan 250022, China
  • Received:2016-12-28 Online:2017-03-29 Published:2017-03-30

摘要:

针对目前在线学习系统练习、测试环节随机抽题的盲目性,基于在线评测数据和Kmeans聚类算法,利用不同的特征子集、不同参数对题目进行聚类。在ACM Online Judge系统的评测数据集上,
以时间波动、平均用时和重复提交率为特征,通过聚类分析建立题目等级分类模型,实现题目难度等级分类,并对不同特征值数量和聚类中心数量对分类效果的影响进行实验研究,以确定最佳分类模型
。实验结果表明,提出的方法简单有效,模型的分类结果符合经验分类结果。

关键词: OJ系统, K-means, 等级分类

Abstract:

To tackle with the blindness of random questions choosing for exercise and test of online learning system, this paper clusters questions by exploiting various
feature subsets and parameters based on online judge data and Kmeans. For the test data of ACM online judge system, the features of temporal fluctuations, mean of time
consumption and repeat submission rate are used to build a classification model which will be optimized based on experimental analysis of number of features and clusters. The
experimental results show that the proposed method is simple but effective, the classification results of the model are consistent with the empirical results.

Key words:  , online judge system; Kmeans; grade classification

中图分类号: