“如何从0-1训练出一个ChatGPT?”( 五 )


在接下来的时间,我们会看到越来越多的企业将部门的知识、企业的知识甚至行业的知识利用人工智能技术变成知识库,变成可以被AI构建和调用的知识,形成知识流,然后让这些知识变成数字人,服务我们的企业,服务我们的客户 。
我们可以预测,在未来的一年,企业服务的这些内容会呈现指数级的增长,会提升至少10倍以上 。从事To B行业的创业者,一定要对此做好准备 。
06
AI产业化,
大模型自身产业会如何发展?
麒麟合盛APUS邓小波
未来的人工智能大模型产业架构,可以与城市生态做类比:
算力是一种资源,相当于土地,需要我们投入真金白银购买、租用或生产 。
大模型相当于基建,可以与专利结合起来,形成有用的数据资产 。就像土地开发一样,单纯土地的价值可能不大,但完成基建建设后,土地才可能会变成有价值的地产 。
在大模型之上,会提炼出各行各业的行业模型和精炼大模型,就像在城市基建基础上,开发出各种不同的商业和住宅 。
在不同的商业和住宅区,还会形成不同的社区生态,大模型应用中同样也会实现不同的产业应用生态,供不同的终端用户或客户使用 。
这就是整个人工智能大模型产业的架构 。
在这里,我们可以看到两个关键点:
1)行业模型在确定性和控制性方面可能比普通消费者使用的模型要求更高;
2)对于消费者来说,更多的模型需要创新和开放,以生成更多新内容 。两者的侧重点可能略有不同 。实际上,在大模型开发中,这是一种能力的体现,你需要有侧重点,以达到最终的生态要求 。
07
AI大模型发展将面临哪些新挑战?
竹间智能孙彬
作为技术从业者,我在这里跟大家分享几个我们看到的新挑战:
第一个挑战就是大模型阅读 or 知识图谱预建?
过去我们做了很多的知识图谱,但是今天的大语言模型可以阅读文档,可以阅读那些非结构化的数据 。那么,到底是不是还需要建立知识图谱?换一种说法,就是今天是要预设好答案,方便来问答和查询,还是要让大语言模型自己去阅读内容,然后给你答案?
其实,这两种实践路径都可以完成很多的内容查询,但是最终哪个效果好,哪个准确率高,我相信应该是不同的场景使用不同的模式 。也许有人会问两种结合在一起会不会更好?答案很值得期待,希望我们的从业团队用工程能力给出结果 。
第二个新挑战是“Prompt?Embedding?Fine-tuning? ”
这三个词都是现在特别热的词 。Prompt是提示词,Embedding指嵌入接口,Fine-tuning指模型微调,都是训练大模型要做的工作 。但目前其实并没有多少团队能够把模型调好,可能在微调的过程中间,越调越差 。
所以今天我给到大家的建议,就是不要迷恋对大语言模型进行微调,最终要以结果可控和高质量目标作为标准 。利用大语言模型的能力加上自身的工程能力,比如对知识图谱、对客户数据的调用,然后利用数据的能力,最终满足客户的需要才是王道 。
第三个新挑战,到底是应该做大语言模型,还是做专业模型?
我的观点是通用大语言模型有它的优势,专业模型也有它的场景,每个模型其实都有它的能力特点 。我们认为通用大语言模型适合于To C端进行对话和训练,专业的模型适合于在行业内调取专业的知识,完成专业的任务 。
第四个新挑战:大模型应该云端调用还是私域部署?
在10年前,大家就在讨论公有云好还是私有云好,其实我们看到今天这两者是并存的 。云计算和AIGC产业发展有相似之处,通用模型适合于各种各样的中小企业,通用灵活;专业模型安全性高,数据可以控制,它要为企业服务,数据要准确,要完成不同的任务 。
所以我们可以这样预测,未来会有几个头部的企业提供最优秀的大语言模型来为大家服务,但同时也会有千千万万的行业私有云、企业私有云,千千万万的行业模型和企业模型 。
未来,公有的大模型一定会越做越强,会由头部的几个企业来领导,行业的私有模型一定会百花齐放,这也是我们很多To B企业的商机 。
我们相信,ChatGPT现象将给我们带来巨大的AIGC红利 。写作类、绘画类、创作类的职业会实现巨大的提效 。
大模型归根到底是一个工具,会使用工具的人将会淘汰不会用工具的人 。
智能家居行业会有很大的发展,过去每个家庭的环境太复杂,所以大家没有办法在家庭环境中预设好各种对话,现在大语言模型应用之后,对智能家居行业又会有很大的促进 。


推荐阅读