重磅丨微软发布数据集MS MARCO,打造阅读理解领域的“ImageNet”

摘要12月17日早些时候,微软在其官方博客上宣布发布了一个包含10万个问题和答案的数据集,研究者可以使用这个数据集来创造能够像人类一样阅读和回答问题的系统
重磅丨微软发布数据集MSMARCO,打造阅读理解领域的“ImageNet”

12月17日早些时候,微软在其官方博客上宣布发布了一个包含10万个问题和答案的数据集,研究者可以使用这个数据集来创造能够像人类一样阅读和回答问题的系统。此外,微软计划效仿ImageNet,与其他人合作、最终创办正式的竞赛等。

这个数据集名叫MSMARCO,表示MicrosoftMAchineReadingCOmprehension(微软机器阅读理解)。其背后的团队声称这是目前这一类别中最有用的数据集,因为这个数据集是基于匿名的真实数据构建的。通过将该数据集免费开放给更多的研究者,该团队希望能够促进机器阅读领域的研究突破,就像之前研究者已经在图像识别和语音识别领域所取得颠覆性突破一样。

他们也希望这次开放能够促进“人工通用智能(AGI/……

这篇文章发布很久了,已经被归档请点击阅读更多文章
© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
相关推荐
  • 暂无相关文章
  • 评论 抢沙发
    头像
    欢迎您留下宝贵的见解!
    提交
    头像

    昵称

    取消
    昵称表情代码图片

      暂无评论内容