重磅丨微软发布数据集MS MARCO，打造阅读理解领域的“ImageNet”-O2O薪媒体

摘要12月17日早些时候，微软在其官方博客上宣布发布了一个包含10万个问题和答案的数据集，研究者可以使用这个数据集来创造能够像人类一样阅读和回答问题的系统

12月17日早些时候，微软在其官方博客上宣布发布了一个包含10万个问题和答案的数据集，研究者可以使用这个数据集来创造能够像人类一样阅读和回答问题的系统。此外，微软计划效仿ImageNet，与其他人合作、最终创办正式的竞赛等。

这个数据集名叫MSMARCO，表示MicrosoftMAchineReadingCOmprehension（微软机器阅读理解）。其背后的团队声称这是目前这一类别中最有用的数据集，因为这个数据集是基于匿名的真实数据构建的。通过将该数据集免费开放给更多的研究者，该团队希望能够促进机器阅读领域的研究突破，就像之前研究者已经在图像识别和语音识别领域所取得颠覆性突破一样。

他们也希望这次开放能够促进“人工通用智能（AGI/……

这篇文章发布很久了，已经被归档请点击阅读更多文章

文章版权归作者所有，未经允许请勿转载。

THE END