当前位置: 主页 > 活动新闻 > 以试图让机器更准确地回答问题

以试图让机器更准确地回答问题

更新时间:2018-02-03 14:16
浏览次数:
  此次ASC18人工智能赛题评判标准是基于各参赛队训练模型的机器阅读理解回答预测的准确率,这就要求队员们尽快学习掌握机器阅读理解与问答的算法特点,并熟练应用CNTK深度学习框架。由于赛题的数据集规模较大,如何充分发掘利用超算硬件的计算潜力也成为赢得比赛的关键。这次ASC18的人工智能赛题要求参赛队伍自己动手开发机器阅读理解的算法模型,运用最新超算技术来加速训练速度及提高精度,更要用真实的问题数据集来验证模型训练的成果,这对处于本科阶段的大学生参赛选手来说,无疑是一次“超级挑战”。
 
  ASC世界大学生超级计算机竞赛(ASC Student Supercomputer Challenge)是由亚洲超算协会和浪潮集团联合发起的世界最大规模的大学生超算竞赛,发韧于2012年,经过7年发展,影响力不断攀升。迄今为止,ASC 竞赛已吸引到全球超过 5500 名年轻人才参与,参赛队伍总数超过1100支。现在,包括微软、卡内基梅隆大学、斯坦福大学在内的顶级人工智能专家和学者们正在研究这项复杂的任务,这一目标若能实现,将意味着当前的弱人工智能向强人工智能迈进了一大步。在前不久的由斯坦福大学发起的SQuAD(Stanford Question Answering Dataset)文本理解挑战赛的最新榜单上,微软亚洲研究院自然语言计算组于2018年1月3日提交的R-NET模型在EM值(Exact Match, 表示预测答案和真实答案完全匹配)上以82.650的最高分领先,并率先超越人类分数82.304。ASC世界大学生超级计算机竞赛18赛季(ASC18)在京正式启动。参加ASC18超算竞赛的全球300多支队伍,将在接下来的几个月里,挑战一项由微软出具的极具挑战性的人工智能赛题——机器阅读理解。ASC18各参赛队将使用CNTK深度学习框架,独立开发机器阅读理解和问答的算法模型,使用最新超算技术结合MS MARCO数据集进行训练,以试图让机器更准确地回答问题。
 
  而从ASC世界大学生超级计算机竞赛已经发布的ASC18赛题可以看到,此次比赛采用的是一个更具难度的机器阅读理解与问答数据集——微软MS MARCO。这个数据集是基于Bing和Cortana上收集的真实数据构建的,包括10万个问题,100万个段落,以及超过20万个文件的链接。此次ASC18竞赛的初赛阶段,微软将提供该数据集中的部分数据供训练模型使用。而在决赛阶段,微软将提供一个全新的测试集来供选手们挑战。同时为了更好的让大学生入手和了解该赛题,微软也同时提供基于CNTK的基准代码和相关论文作为参考。
 
  
相关推荐