当前位置：首页 > 职场 > 正文

由微软和OpenAI支持的哈佛新开源数据集推动人工智能的发展

哈佛大学发布了大量免费的人工智能训练数据集，人工智能突飞猛进。在微软和OpenAI的支持下，这个数据集为人工智能初创公司提供了公平的竞争环境。它包含各种各样的文本，使其成为机器学习开发人员的关键资源。这一举措出台之际，围绕人工智能训练数据使用的版权问题正在进行辩论。

人工智能训练数据集革命

哈佛大学最近宣布与微软和OpenAI确实成为了人工智能世界中令人兴奋的火花。新的数据集旨在提供前所未有的文本访问，从文学经典到小众学术材料，旨在加强人工智能模型的训练。

这个数据集大约比臭名昭著的Books3数据集大5倍。它由机构数据倡议（Institutional Data Initiative）提出，包含了跨越流派、时代和语言的作品。莎士比亚和但丁等作家的经典文学将与专业文本共存。

执行董事格雷格Leppert强调了这个项目的目的

本文根据道德政策的原则，使用了来自开放资源的信息。编辑团队不负责绝对的准确性，因为它依赖于参考来源的数据。