2023年11月,非政府组织无国界记者(RSF)和新闻信息联盟(Apig)宣布在“Spinoza项目”框架内合作,目标是开发一种面向记者的开源生成式AI。2月10日,随着人工智能行动峰会在大皇宫开幕,两家合作伙伴发布了报告“SpinozIA,迈向增强和伦理的新闻业”,展示了项目实验的观察和结论。

Spinoza项目的目标是“开发一种为记者服务的人工智能工具,保障媒体对其出版物的知识产权”,同时“服务于可靠的信息和可信的新闻业”。

该项目由RSF发起,于2023年10月启动,涉及来自12家新闻公司的120家联盟成员媒体:Actu.fr、EBRA、L'Équipe、La Nouvelle République、La Provence、Le Télégramme、Libération、l’Union、Nice-Matin、PMSO、Sogemedia和Sud Ouest。

这个项目并不是要证明生成式AI可以取代记者的工作,而是可以通过可靠的数据来丰富它。与Ekimetrics合作开发的原型是一家专注于AI和数据科学的公司,旨在改善气候变化和生态转型的媒体处理中的文档搜索和数据重述。

该工具利用OpenAI的GPT 3.5语言模型和嵌入算法(一种搜索引擎,探索文本以寻找与所提问题意义相近的术语),到2024年3月,它被12,000篇新闻文章、政府间气候变化专门小组(GIEC)的科学报告、法国法律文本、环境与能源管理署(ADEME)的报告以及法国政府低碳战略文件所支持。

得益于法新社(AFP)的数据,该社于2024年7月加入项目,新闻数据集还通过区域数据得到了丰富,如今它包含自2022年以来法国新闻媒体发布的28,450篇文章。这填补了其他来源的不足,例如通常仅限于特定地区或相反描述非常大范围现象的科学报告。

这种合作工作展示了新闻内容与其他数据源的互补性和丰富性,以及它们对生成式AI工具的价值。

工具传递的所有信息都有来源,以便记者可以追踪和验证。

SpinozIA,迈向增强和伦理的新闻业

报告除了介绍Spinoza项目团队遵循的方法外,还展示了一项关于记者对生成式AI感知的研究。

问卷由Econovia机构设计,用于评估记者与生成式AI的关系,调查了在法国工作的281名记者。它表明,尽管使用生成式AI的潜在风险如对编辑处理的控制丧失、误导信息或AI对工作条件的潜在影响等存在担忧,记者们仍将生成式AI与生产力提升联系在一起。

实际上,45%的受访法国记者已经在其职业实践中使用AI,并且93%计划使用它来:

• 翻译文件;
• 生成采访记录;
• 综合信息;
• 重述文本;
• 生成文章摘要。

研究还强调记者们意识到他们在AI发展中扮演的角色:86%的人认为他们是确保这些工具在新闻信息领域中负责任使用的最佳人选。

无国界记者的建议

在这份报告中,非政府组织向媒体提出了十项建议,以建立必要的伦理和技术框架,确保在新闻业中使用的AI系统的信息完整性:
  • 在编辑部中基于伦理参考框架来规范AI的使用和实践;
  • 开发Spinoza项目的扩展并与新闻业社区分享,以便第三方审核;
  • 启动媒体之间的AI工具开发合作项目;
  • 尊重新闻出版商的邻接权和记者的著作权;
  • 在生成系统的设计中调动新闻工作方法,并指定编辑负责人;
  • 保持生成式AI工具中使用的数据库的更新,确保其可靠性;
  • 追踪数据库中使用的所有来源的起源;
  • 根据每个数据库调整提示词;
  • 以协作方式定义提示词;
  • 在使用LLMs时保持独立性。
报告的发布是项目开放的第一步:其代码将很快在Hugging Face平台上以开源形式发布,以便记者和开发者根据他们的需求定制和调整工具。

RSF总干事Thibaut Bruttin总结道:

“RSF致力于开创一条伦理和负责任的道路,创新不意味着边缘化新闻业。Spinoza项目实现了这一点,重申了编辑部在选择、排序和生产高质量内容中的核心作用,以及生成式AI系统中新闻内容不可否认的附加价值。记者和编辑有能力重塑新闻业,只要他们能重新赋予其技术主权。感谢联盟、其管理层及其成员对这一项目的兴趣。”