Baidu加速GenAI,推出ERNIE 4.5和ERNIE X1两款免费模型

Baidu加速GenAI,推出ERNIE 4.5和ERNIE X1两款免费模型

TLDR : 百度推出了ERNIE 4.5和ERNIE X1,免费开放给公众,旨在增强其在AI领域的影响力。

随着R1的发布,DeepSeek不仅在硅谷引起了巨大反响,还加剧了中国国内的竞争。今年二月,中国GenAI的主要参与者百度宣布,将于今年六月开源其AI模型Ernie,并免费提供Ernie Bot聊天机器人。昨天,百度进一步加码,发布了其最新的多模态基础模型ERNIE 4.5以及侧重推理的ERNIE X1。ERNIE X1的性能可与R1媲美,但价格仅为其一半。这两者都整合在Ernie Bot中,使得Ernie Bot比预期更早免费。
据百度称,ERNIE 4.5在理解、生成、推理和记忆方面取得了显著进展。该模型尤其在幻觉管理和逻辑推理优化方面表现出色。其同时处理文本、图像、声音和视频的能力使其成为从对话到内容创作的各种应用中强大的工具。
模型的改进归功于几项关键技术,包括动态注意力遮盖“FlashMask”、异构多模态专家混合、时空表示压缩、知识中心的训练数据构建以及更好的后训练自反馈。
公司声明称,ERNIE 4.5在多个基准测试中超越了GPT-4.5,同时成本降低了100倍。
另一方面,ERNIE X1专注于多模态推理和高级工具的使用,在规划、分析和解决复杂问题方面表现卓越。其特定功能包括高级搜索、图像生成与解释、网页阅读以及通过TreeMind进行概念映射。

对可及性和竞争力的赌注

通过为大众免费提供这些模型,并通过其云平台Qianfan为企业提供有竞争力的价格,百度旨在加强其在AI生态系统中的影响力。ERNIE 4.5的定价为每千个输入标记0.004人民币(约0.0005欧元),输出为0.016人民币(约0.002欧元),而ERNIE X1的价格更低:输入为每千个标记0.002人民币(约0.00025欧元),输出为0.008人民币(约0.001欧元)。
这种激进的定价策略伴随着将生成性AI民主化的愿景,并逐步将这些模型整合到百度的产品和服务中,尤其是其搜索引擎和Wenxiaoyan应用程序。
通过提供性能可与R1媲美但价格仅为一半的模型,百度明确表达了其不仅在中国而且在面对美国竞争者时主导该行业的雄心。

Pour mieux comprendre

什么是动态注意力屏蔽「FlashMask」,它如何工作?

动态注意力屏蔽,称为「FlashMask」,是一种用于AI模型的先进技术,旨在优化处理多模态数据时的注意力分配。它允许模型动态地集中和调整其对输入数据最相关部分的注意力,从而提高处理效率和结果的准确性。

百度在中国将其AI模型Ernie开源的监管影响是什么?

百度的AI模型Ernie的开源可能会带来重大监管影响。在中国,政府在推动技术创新的同时,积极确保国家安全和网络安全。百度将需要在这个复杂的监管环境中保持合规,遵守数据保护法律和技术出口相关的法规,同时努力促进国际合作和开放创新。