7月19日消息,“新版文心一言的能力已经突破3.5,这也是我国相关技术工作发展的一个重要里程碑。” 百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴天对网易科技等媒体表示。
她介绍,IDC最新发布的《2023年AI大规模模型技术能力评估报告》显示,百度文心大规模模型3.5在12个指标中获得7个满分,在综合得分、算法模型、行业覆盖率等方面均排名第一。
据悉,IDC评测报告重点围绕产品技术、服务生态、行业应用三个维度,考察大型机型10余项指标。 国内主流大型机型包括百度、阿里、腾讯、华为、科大讯飞、360、商汤科技等,共有14家厂商参与了本次评测。 报告结果显示,百度文心在模型能力、工具平台、生态布局、行业覆盖等方面优势明显,已提前进入商业化探索阶段。
吴天介绍,百度从2019年开始深度参与预训练模型的研发,并陆续发布了一系列知识增强的文心模型。 不久前,百度正式发布文心大模型3.5版本,在基础模型、知识增强、检索增强等多项核心技术上进一步进行创新。 新版本对各项功能进行了显着提升。
具体来说,她表示,文心大规模模型取得“第一”得益于百度的“芯片-框架-模型-应用”四层技术栈优势、知识增强的核心特征以及繁荣大规模模型的三大优势生态。 尤其是百度自主研发的深度学习平台飞桨,有力支撑了大模型的高效训练和推理。 飞桨与文心的协同优化,使文心大模型3.5最新版本模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
在大规模模型生态方面,她介绍说,百度文心已经形成了集企业、教育、社区为一体的生态系统。 最新数据显示,百度拥有超过750万的开发者基础和20万家企业的生态基础。 多层次开展大规模人才培训、企业赋能、开发者运营。 百度还设立10亿风险投资基金,鼓励大规模模型创意,繁荣大规模模型生态。
她直言,大模型产业化仍面临巨大挑战。 总结起来有三个方面:第一,大模型的规模确实很大,带来训练难度高、成本高; 第二,对算力规模的要求非常大,性能要求非常高; 第三是数据规模也非常大,收集、挖掘、构建、筛选、清洗这些数据本身就是一个非常大的工程。 “大模型平台是一个昂贵的系统,具有很大的计算能力。事实上,根本不需要大量的大模型,而且对于应用者来说,没有必要为每个应用程序开发大模型。”
至于“百模大战”的结局? 吴田表示,“过去几个月,出现了大量新的大型车型,但这只是阶段性现象。未来,各企事业单位会逐渐找到自己的定位,下一步将做自己的细分领域,只会专注于几个大的车型,但依托几个大的车型,就会有非常广泛的应用生态。”
广告声明:文章中包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息,节省选择时间。 结果仅供参考。 IT之家的所有文章均包含此声明。
0条评论