哈佛大学发布了大量免费的人工智能训练数据集,人工智能突飞猛进。在微软和OpenAI的支持下,这个数据集为人工智能初创公司提供了公平的竞争环境。它包含各种各样的文本,使其成为机器学习开发人员的关键资源。这一举措出台之际,围绕人工智能训练数据使用的版权问题正在进行辩论。
由微软和OpenAI支持的哈佛新开源数据集推动人工智能的发展
人工智能训练数据集革命
哈佛大学最近宣布与微软和OpenAI确实成为了人工智能世界中令人兴奋的火花。新的数据集旨在提供前所未有的文本访问,从文学经典到小众学术材料,旨在加强人工智能模型的训练。
海量数据集概述
这个数据集大约比臭名昭著的Books3数据集大5倍。它由机构数据倡议(Institutional Data Initiative)提出,包含了跨越流派、时代和语言的作品。莎士比亚和但丁等作家的经典文学将与专业文本共存。对人工智能发展的影响
执行董事格雷格Leppert强调了这个项目的目的
本文根据道德政策的原则,使用了来自开放资源的信息。编辑团队不负责绝对的准确性,因为它依赖于参考来源的数据。
有话要说...