今年年初,ChatGPT像一声惊雷,让全球见识到了生成式神经网络大模型的威力,并迅速掀起一阵大模型创业潮。然而,在经历了大半年的“狂飙”后,市场对大模型的狂热走向冷静,更多人选择将目光投向真正高性价比的AI。
本期【知微见著】试图从经济视角分析大模型的技术弱点,以剖析大模型热潮表面下的一些深层次矛盾的原因,启发读者以更理性的观点来思考:什么样的AI才能为我们提供更可持续的智能化解决方案。 大模型告别“狂飙”时代 随着公众“审美疲劳”、投资人们趋于谨慎观望,更多数据显示,ChatGPT涨不动了。 平台访问量增速放缓是最显著的表现。SimilarWeb数据显示,平台访问量从1月的环比增长131.6%,到2月的62.5%,再到4月接近跌破10%,6月首次出现负增长,跌幅达到9.7%。同时,用户平均访问时间从8分32秒下降到7分48秒。 2023上半年ChatGPT网站浏览增长趋势|数据来源:SimilarWeb 在资本市场的热度褪去。ChatGPT“降温”,AI概念股的疯狂上涨也戛然而止,473只AI概念股超300只下跌。中国经济网最新报道,ChatGPT概念板块整体涨幅-1.41%,72只股票下跌。 对此,不少行业专家认为,AI大模型产业已经出现过热的端倪,产业泡沫化风险在一定程度上已经出现。 技术弱点决定了落地应用局限 国内外AI大模型带给世界的兴奋感为何转瞬即逝?究其原因,主要在于落地应用不易。 生成式神经网络大模型背后的技术特质决定了它注定是“少数人的豪华游戏”。高成本算力和落地应用不匹配,盲目跟风、一哄而上势必会加速市场泡沫。 上一期,我们在《知微见著 | 捍卫数据安全,我们需要怎样的AI?》文章中曾给大家介绍过大模型的技术原理: 像ChatGPT等这类大语言模型属于经验主义AI。这类基于神经网络大规模训练的AI,主要通过数据训练获取经验,AI水平取决于模型参数规模和数据规模;并且无论规模大小的知识更新与迁移,都需要重新或者补充训练;不适用于数据敏感行业。 也就是说,生成式AI本身就是很“烧钱”的,单是训练成本就极其昂贵。以OpenAI为例,GPT-3的单次训练成本就高达140万美元,对于一些更大的大模型,训练成本介于200万至1200万美元之间。用知名计算机专家吴军的话来形容,就是“ChatGPT每训练一次,相当于报废了3000辆特斯拉汽车。” 在巨额成本中,算力占最大头。生成式AI大模型需要超大规模算力支撑,而提供算力的GPU昂贵且短缺。比如,ChatGPT依赖于英伟达A100显卡,OpenAI训练GPT-4用了上万片英伟达A100。 同时,模型训练又是一个相对复杂的系统,涉及到数据保障、训练框架等诸多方面,需要对整个复杂系统有很强经验的强大人才储备,这又是一笔不小的人力、物力成本。 大模型本身在当下并无法解决高算力成本和落地应用不匹配问题。而企业级用户追求应用的稳健性、经济性、安全性、可用性和合规性,它还不能满足。 什么样AI才能提供更可持续的智能化解决方案? AI大模型是一个“拼算力”的赛道,而现阶段,我国并没有优势。国产人工智能芯片仍与世界一流水准有一定差距,而我国高端芯片面临“卡脖子”难题,一时无法满足大语言模型的算力需求。 美国人用大模型将我们拖入了这场竞争,如果跟,不一定能赶超美国;不跟,一定会落后于美国。但只是盲目地追赶,就会被“牵着鼻子”在这条没有优势的赛道上走至少十年。所以,在跟跑大模型的同时,我们需要“换道超车”。 走语义工程之路就是一条真正可持续的道路。基于语义工程的理性AI既可以节省算力,也可以解决落地应用问题。 利用语义工程实现中文语义结构化能够大大节省神经网络训练的算力成本。神经网络训练的成本与待识别结构的复杂度成正比,因而中文的训练远比英文高。据牛津大学的一项研究显示,简体中文的训练费用大约是英文的两倍。但如果基于语义工程,对中文语义结构进行人工标注,则大模型训练可以从语义结构开始,成本会大大降低,甚至低于英文训练的成本。 以“积少成多”模式赶超大模型训练模式,规避后续重复训练的成本。基于中文语义结构化,可实现仿人类学习过程,不需要大规模数据训练,把大模型的建设“化整为零”,通过仿人类碎片化阅读,逐步积累专业知识的过程,直接在单位内部获取大模型类似的能力,提供特定垂直领域的智能化服务,能够给予企业用户更多定制化空间。尤其对需要在单位内独立部署系统处理高敏感数据的行业来说更具实用性。 随着中文语义结构走向标准化,将增加神经网络模型之间的兼容性,同时也为可解释性知识库与神经网络模型之间、机器智能体与人类之间提供一个沟通交流知识的基础,降低沟通、连接成本,有助于消除“AI孤岛”。 人工智能领域已经历了巨大的变化,而人们也已从最初追捧和炒作大模型的狂热中逐渐冷静下来,开始认真思考其应用价值和发展途径。 AI的实际应用总是需要考虑多方面的问题,包括技术性能、使用成本、响应速度、行业专业性等。选择市面上更可持续的AI,让人工智能真正转变为生产力,实现技术与行业之间的双向奔赴,实现场景与生态同频共振,才是更优的选项。 联著实业自有知识产权的语义工程技术,在经济适用性、灵活可配置、数据保护等方面具有先天优势。目前已广泛应用于档案智能开放审核、泛金融合规审查、医疗智能诊断、法院立案智能辅助,为20000余家客户提供智能化服务。 放眼未来,联著实业将继续“以技促用”,发挥理性主义AI的价值,推动“AI+”行业应用创新发展。 来源参考: 《傅盛:大模型的弱点,才是我们的创业机会》 https://mp.weixin.qq.com/s/Z5NueaU6_VP4b-m27LiJ2g 《三问大模型,AI的路在何方》 https://zhuanlan.zhihu.com/p/580745171 《经济日报:大模型热要多点冷思考》 https://mp.weixin.qq.com/s/KcSqAhXQCVQhXgZ8o43m8Q https://mp.weixin.qq.com/s/w7bBafwZ5V-cASk6f3YHCw https://mp.weixin.qq.com/s/B3GdHa4tJueGqxGZAr4v_g https://mp.weixin.qq.com/s/nYh-JXtSkxjGlTscvt_kuQ《大模型的混沌年代:矛盾、分化与未来》
《ChatGPT增长放缓,98%的大模型要死掉|钛媒体焦点》
《AI大模型的背后:既要热追逐,也要冷思考》