文心大模型4.0首发四项关键能力显著提升_智能生活

文心大模型4.0首发四项关键能力显著提升

智能生活 2023-10-18 创始人

科技日报记者刘艳

10月17日，文心大模型4.0在“百度世界2023”发布并开启邀请测试，搜索、如流、地图、网盘、文库等百度AI原生应用以全新面目亮相。

百度首席技术官王海峰说：“文心大模型4.0基本技术架构与3.0和3.5版本一脉相承，在多个关键技术方向上进一步创新突破。理解和生成能力提升幅度相近，逻辑和记忆能力的提升更大，逻辑的提升幅度达到理解的近3倍，记忆的提升幅度也达到了理解的2倍多。自9月开始小流量上线，过去一个多月效果又提升了近30%。”

谈及文心大模型4.0，百度创始人、董事长兼首席执行官李彦宏难掩自豪：“这是迄今为止最强大的文心大模型，实现了基础模型的全面升级，综合能力与GPT-4相比毫不逊色。”

这么显著的效果提升是怎么实现的？

王海峰介绍，技术人员在万卡算力上运行飞桨平台，通过集群基础设施和调度系统、飞桨框架的软硬协同优化，支持了大模型的稳定高效训练；建设了多维数据体系，形成了数据挖掘、分析、合成、标注、评估闭环，充分释放数据价值，大幅提升模型效果；基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐，保证模型更好地与人类的判断和选择对齐；可再生训练技术通过增量式的参数调优，有效节省了训练资源和时间，加快了模型迭代速度。

据了解，在强大的基础大模型的基础上，百度进一步研制了智能体机制，包括理解、规划、反思和进化，能够做到可靠执行、自我进化，并一定程度上将思考过程白盒化，让机器像人一样思考和行动，自主完成复杂任务，在环境中持续学习实现自主进化。

当下，大模型已成为人工智能发展的热点方向和新型工业化的重要推动力，但应用层面的挑战始终存在，如何破除大模型进一步普及的阻碍？

“过去一年，科技领域最大的创新是大模型带来的智能涌现，并成为开发AI原生应用的基础。”在李彦宏看来，AI原生应用，就是基于大模型的理解、生成、逻辑和记忆能力开发出来的应用，而这些能力是过去时代所不具备的，因此才能打开无限的创新空间。

今年5月，百度提出用AI思维重构所有产品，做出AI原生应用，“百度世界2023”大会上，百度通过展现基于文心大模型技术土壤重构的十余款AI原生应用，给出了大模型应用落地的有效路径。

（百度供图）

The End

免责声明：本文内容来源于第三方或整理自互联网，本站仅提供展示，不拥有所有权，不代表本站观点立场，也不构成任何其他建议，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容，请及时联系我们进行处理。

文心大模型4.0首发四项关键能力显著提升

分类导航

最新文章

本栏文章

随机文章

友情链接

文心大模型4.0首发 四项关键能力显著提升

相关阅读

分类导航

最新文章

本栏文章

随机文章

友情链接

文心大模型4.0首发四项关键能力显著提升