随着以互联网为首的应用工具的快速发展,人工智能似乎在应用层面找到了合适的出路,让公众、用户和行业看到了大规模人工智能的应用潜力。
大模型能为企业和开发者带来什么?
企业如何借力、追赶大模式,创造真正的价值? 由此产生的大型人工智能模型浪潮将如何影响开发者和企业?
如何应对其背后的伦理挑战和风险问题?
在InfoQ《与极客约会》直播间,明略科技集团CTO郝杰针对上述问题发表了自己的看法和见解。
社会和企业如何从共同的大型模型中受益?
它所代表的大规模模型是一种不太显式的新型知识表示,它不同于知识库和知识图谱。 它是一个巨大的隐性知识库,包含了地球上的各种知识,类似于一本包罗万象的百科全书,用户可以使用这个模型在平台中移动并与之交互,以聊天、对话的形式展开,或多轮问答。
面对大规模模型和通用人工智能的冲击,行业之间的差异应该是相对均等的。 在科学领域,大模型原生应用的场景还包括超导材料、生命科学、医学、生物医学等各个科学领域。 这些领域很可能是大模型大显身手的场景。 许多公司正在做一些令人惊奇的事情。 他们想把地球上所有的知识整合到一个模型中,他们想造福全人类。 未来它的发展方向应该是惠及各行各业,让设计师、厨师、化妆师等从业者变得更强,更容易修炼到大师级别。
在中国建立大型中国模式有多种方法。 首先是依靠大企业或者国内顶尖大学,它们拥有强大的计算能力和资源,可以在他们的肩上培养大型的行业模型。 第二类是垂直领域的AI独角兽公司,比如明略科技,从垂直领域出发,打造专属行业模式。 第三条路径是利用摩尔定律,通过突破工程难点来降低大型模型的训练成本。 虽然这是一个挑战,但已经有一些公司在努力,相信随着时间的推移,培训成本会逐渐下降。
真正的最大值是多少?
它在四个方面具有很强的通用性:从产品上来说,它是聊天形式的人机交互,几乎所有人类都可以与之交互,用户使用没有门槛。 是一个非常通用的ToC产品; 从模型上来说,它是一个通用的大型模型,包含了地球上所有的知识,几乎是无所不知的,因此具有知识领域的通用性; 在任务方面,具有很强的泛化性和跨任务通用性; 以及与人类对齐的多功能性,通过RLHF算法,可以与人类的各种价值观、道德、偏好等对齐,而不仅仅是与少数算法工程师制定的准则对齐。 这四个共性是过去的AI所不具备的。 这就是价值所在。 它具有开创性,所以从诞生之日起就受到如此多的关注,因为它各方面的通用性太强了。
如何判断大模型的效果?
在评选和评价方面,我提出了“四大一小”的评价标准。 “四大”是指上述四个方面的通用性,其通用性是否足够大。 “一小”是指用辩证法追求参数较少的模型。 如果在“四大”的维度中,大模型的性能相似,表现出类似的召回率、准确率等,则可以选择参数较小的模型,因为这意味着部署成本更低,维护成本更低并且迭代也更容易。 在学术界,它被称为“参数效率”。 参数效率是评估大型语言模型的重要原则。 参数效率 ,包含在清华大学孙茂松老师团队刚刚发表的一篇重要论文的标题中。 参数效率,类似于汽车发动机每升的功率,并不意味着排量越大越好,意味着消耗太多燃油,或者消耗电费和卡费。
企业追赶大型车型浪潮,如何做出改变?
大模型出现后,企业希望利用此类工具来提高效率和服务质量,但同时也表达了一些担忧。 例如,输出质量是否稳定? 在自己的垂直领域引入这样的技术后,可能会导致内容偏激或者误导。 遇到这样的情况该如何处理呢? 另外,由于目前一些大型模型无法私有化和部署,将企业自身的知识上传到大型模型平台是否会降低企业原有的门槛?
这正是明略科技能够帮助客户在AI应用技术冲击下提升竞争力的地方。 明略科技作为客户与大车型之间的桥梁,不仅要保证这条路安全可靠,还要满足客户的实际需求。 借鉴通用大规模模型训练的优秀算法,基于17年积累的大量行业数据,从客户的实际需求出发,定制垂直领域的大规模模型,满足多样化的任务和场景。
通用型大车型的出现固然让企业可以无差别地享受便利,但便利之下真正的需求是如何用好大车型。 真正能够“突围”的,是企业、行业的数据。 每个企业都有自己特色的知识积累,可能是数据库,也可能是标签库,也可能是知识图谱。 在行业方面,明略科技凭借17年的行业探索,在知识图谱方面积累了大量丰富的经验,尤其是在消费行业。 比如美容、3C、汽车、大健康等领域,知识图谱的知识表达形式更加先进,有实体有联系,有逻辑推理。 图中的实体和关系决定了基于图生成的文章或图片的真实性、专业性和逻辑性。 明略科技可以帮助客户与私有知识和大模型进行竞争,类似于微软的架构,让客户的数据飞轮能够更好地运行。 对于营销文章的生成,明略科技离不开知识图谱,知识图谱可以保证文章的真实性、可解释性、专业性。 一代之后,大模型还将进行打磨,以满足客户的多种需求,包括款式修改和客户的特殊要求。 这种方式既考虑到了多维度的需求,又让客户放心使用。
与其说它正在推动新一轮人工智能爆发,不如说自然语言大模型带来了量变到质变的转变。 作为一家深耕数据智能17年的企业,明略科技充分挖掘数据价值,针对不同领域制作规模化的行业模型,并不断更新和维护领域知识库,为客户提供更精准、更智能的技术和服务。服务。 准确完成自然语言处理任务。
大规模模型应用落地之路如何走?
在当前的生态环境下,完全依靠神经网络和深度学习来解决所有问题是非常困难的。 例如,由于敏感信息是动态变化的,每天都会出现新的敏感词,因此该模块可以集成到搜索引擎或客户的数据平台中,使用规则和词汇进行处理,而不是依赖完整的联结主义大模型。 问题可能是多维的,需要根据具体情况选择解决方案。
对于大语言模型和垂直领域模型的结合,耦合或协作的方式有很多种。 其中一种方法是使用两种核心算法(指令微调和 RLHF)进行监督微调,但可能需要更多数据。 另一种方法是将客户的知识库嵌入到大模型中,因为大模型可以处理各种不同类型的知识,只要它们嵌入到同一个连续向量空间中即可。 我们还可以嵌入多模态、跨领域、跨语言的知识,只要同意将它们嵌入到同一语义空间中即可。
我国很多行业都需要将大型车型、营销、销售和服务体系等私有化,这是由自身行业的特点决定的。 然而,大型模型的大量资源消耗将导致此类项目的利润率非常低。 因此,针对此类客户,明略科技提供灵活适应性的模型训练服务,帮助他们充分利用自己积累的资源。 数据,训练适合它们的模型。
除了将大规模模型应用于传统业务产品之外,还会出现一些基于大规模模型的应用产品和服务。 目前我们已经看到以AIGC为代表的一类图像生成应用产品的崛起,未来还会出现一些视觉视频生成应用产品。 的出现,也导致了很多以前可能不存在的文本生成公司的出现,它们的业务现在完全围绕着大型模型展开。 这些公司的共同点是他们生成内容的能力,其中包括生成、创意甚至咨询等内容。
领先的大规模模型工具重燃了人类对通用人工智能的信心,但不同领域的应用之路仍需探索。 明略科技将充分发挥自身优势,让客户的行业知识和数据与大模型互相帮助,真正用好大模型,提高营销智能和运营智能产品的效果。
广告声明:本文所包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息并节省选择时间,结果仅供参考。 IT之家所有文章均包含此声明。
0条评论