中国大模型企业如何存活?中美差距如何缩短
【导读】2024年1月8日,数字强国系列第六讲即163-6以《2024:开启数字与智能经济的融合时代》主题作为收官之讲,邀请知名经济学家、横琴澳粤深度合作区数链数字金融研究院学术与技术委员会主席朱嘉明做同名主旨发言,上海智慧城市发展研究院院长盛雪锋、上海人工智能实验室大模型生态总监许劭华、东方财富人工智能研究院首席科学家刘志毅应邀展开对话。10位听友参与互动,上海树图区块链研究院研究总监、Web3专场主讲嘉宾杨光博士参与提问点评。50位现场听友获得本期NFT数字藏品。
本期讲座由文汇报社、上海树图区块链研究院共同主办,文汇报视频号、喜马拉雅·听视频直播,上报集团融媒空间技术运营团队技术支持。
现经整理,分主讲、对话、提问三篇刊发讲座内容。此为提问篇。
垂直大模型成本在降低,逐步优化或是生存更优选择
上海联通公司职员刘嵘:中国涌现出大量的大模型企业,大多在C端应用。在B端应用上,存在训练成本高、推理成本高以及私域数据难管理、存储私密性的门槛,中国的大模型企业该如何存活?
盛雪锋:你说得很对,大家都在做大模型,很多企业号称在做通用大模型,其实并不通用。
第一,对普罗大众的企业来说,它们的机遇在垂直类大模型,比较坚定地推进本行业甚至本企业垂直领域的模型构建,应该是对未来较好的投资。
第二,据我们监测和观察,投资成本正在快速降低,以至于能力较弱的企业也能承受投资资本。比如上海某知名的人工智能企业开发布会时表示,由它们基础底座大模型训练新的垂直领域的模型,成本约为十万人民币。所以,稍微有点规模的企业都能承担这点成本。
第三是数据。很多大模型本身训练得很好,并不像大模型刚兴起时需要海量训练体量。有些学校把科研成果拿出来也能训练出与它自己适用的大模型,逐步优化完善会是更好的选择,而不是一次性找到大量数据求一蹴而就。
*亟需建立区域级大模型实验室,定出分类标准精准开发
朱嘉明:目前大模型并没有分类,所以比较杂乱。因此,现在要加快对大模型分类,无论是通用型、偏通用型,还是偏垂直领域,都需要有一套衡量体系,确定参数内涵。
在制定标准过程中,要注意如何衡量大模型效益的发展潜力,大模型的硬件体系,以及大模型之间的接口。现在,大模型似乎处于群众运动阶段,很多模型都会自生自灭,浪费很多资源。在上海这样的发达地区,当务之急是建立区域级大模型的实验室,形成对所有大模型和C端B端或G端结合的评估模式。
大模型出现,“劳动”本身变成消费、贡献和生活方式
复旦大学马院在读博士生汤瑭:AI大模型能否替代人类的情感劳动?如不能替代,AI大模型如何与之进行有效互动,从而既有利于自身的升级进步,又做到劳动者合理的价值分配?
朱嘉明:事实上,在进入上世纪工业化社会后,“劳动”这一概念已被反复更新和改变。到了数字时代中后期以及智能时代,“劳动”进一步蜕变,劳动本身就变成了消费、贡献和生活方式。在智能时代,劳动会从形式到内容都发生实质性的变化,更多人因为大模型卷入到人工智能特定劳动状态。例如,网红每天制作的小视频过程也是劳动,只是这个劳动会与消费结合。
AI已位于新基建的核心位置,大模型需求呈“乐高化”
上海市外国投资促进中心杨峥臻:在人工智能发展如此受到世界关注的今天,上海若希望在AI产业获得更好的发展,从投资促进的角度看,可以做些怎样的工作,营造怎样的生态环境?
朱嘉明:过去几年,加密数字货币、Token、NFT、DeFi、区块链、元宇宙、Web3、DAO等,从不同方面在强化数字时代创新。但是,所有这些技术,最后还是被算力和算法所控制。例如,与元宇宙不可分割的数字孪生,虚拟人的设想,理论上没有障碍,但实际做不到,技术上不足以支撑。今天,因为人工智能,这些过去做不到的事现在有可能实现。
因此,因为人工智能,导致了过去的创新进入到收敛过程,并且可以通过人工智能联结在一起。所以,现在要强化数字和人工智能创新的基建结构。过去谈新基建结构时,并未把人工智能放在核心位置,今天人工智能处在核心位置。
大模型就是复杂和多维的矩阵。可以这样想象:未来的大模型会“乐高化”,即不同的大模型之间有分工,加上垂直模型,构成 “乐高”排列,每个企业或政府不可能依赖于一个模型,它需要通过若干模型支持目标和前景。
让大模型辅助基础科研不能一蹴而就,短期不高估长期不低估
华东理工大学在读博士生侯志伟:技术的本质是技术的组合,技术的基底是“现象”,让AI走进实验室去识别新的现象(图像识别)加之AI的分析能力,这是否意味着AI会具有人的创新能力?AI参与实验积累之后接入现有知识数据库,是否可产生新知识或新技术?
许劭华:用AI识别科研领域的多种数据元素,可属于AI for Science研究范畴,它显示出几个典型特征,一是它涉及到的元素都非常复杂,从标注到解读的门槛都很高,二是领域中可用于训练的数据较少,因为自然科学中没有那么多数据,也无法简单地生成。
技术新生事物往往遵循这样的规律,不要过高预估它短期成效,但不要低估它长期的成效。科技新生事物往往遵循这样的规律:初期,需要投入很多专业人员给予数据准确的标注,并不断调整优化算法。一旦具有合适的场景、合适的数据驱动之后,它会具备有很强的归纳能力和推理能力,能带来科研方向上明显的加速。
这里要强调的是,它不是一蹴而就的,即便找到了足够多的数据,研发了适合的算法,也无法完全代替传统的科研,它需要做基础科研人员与AI的研究人员共同合作,AI未来会为科学研究带来更多可能。。
上海具备人才、技术优势,要善用新政策创新业态、新型企业
华东理工大学商学院经济学研究学者蒋士成:什么样的经济制度更适合智能时代的发展?上海应该发挥哪些制度优势来发展人工智能产业和经济?
朱嘉明:人工智能,包括今天反复讨论的大模型,确实是非常前沿的突破。从历史的角度看,它是过去许多原来比较成熟的技术的组合。组合不一定先进,但先进一定来自组合。在今天,上海需要持续创新和创造,核心是不断完成突破和前沿科技的组合。这是个巨大挑战。
每个时代都会发生两种情况,一方面是因为有新技术、新思路,或者有新观念,改变和改组原来的经济形态;另一方面,基于这种新技术来创造全新的企业。上海足够大和人才相对比较丰富,可以实现双向优势,既拥有对传统产业行业和企业的改造能力,也具备创造全新产业的可能性。
上海面临的挑战是,如何凭借这样的基础产生新的企业。目前为止,在AI垂直领域中,到底爆发了哪些新企业?第一类行业是AI写作工具,如Jasper AI等已成为新兴行业,许多从未听过的代表企业横空出世,融资数亿美金。第二类行业是AI思维导图工具行业,包括PPT、模板、扣图等,这些行业开始只有数十人,但发展极快。现在唱歌、绘画、舞蹈、音乐都有世界级企业。
上海在这方面极具潜力。问题是由谁组织、推动,有怎样的政策支持,让这些新型企业像雨后春笋一样产生。现在技术已很成熟,资本并非短缺,关键还是要有人和团队。
在任何历史阶段,实体经济很重要,但不要把未来发展局限于实体经济的范围之内。实体经济需要人工智能化,现在要产生全新的与人工智能相关的新型企业和新型行业,已刻不容缓。
中文在大模型语料中占比较少,亟需全社会共同思考解决方案
退休教师方洛克:您今天的演讲中提出很多耳目一新的关键词,包括生态、或然率、硅基人类和乐高化等,极具前瞻性。我前不久参加亚马逊生态训练,训练中使用中文很难通过,必须要用英文。请问如何从竞业上构建生态?
朱嘉明:因为大模型,推动知识图谱和语料发育,涉及到哪种自然语言比重更大。目前,在大模型的训练中,占第一位的语料和真正直接相关的自然语言是英文,中文的比重与我们在全球人口中的比重并不一致。
从长远来看,自然语言在大模型中的差距会变得更加严峻。因为训练自然语言的数据越多,发展越快,失衡也愈加严重。现在,人工智能最大的困难是,大量新概念已经来不及或没有能力翻译成汉语,大量缩写无法表达。这是亟需正视和解决的挑战之一,全社会不仅要关注,而且要寻求较好的解决方案。
既要承认与美国的十年差距,也要对未来超越持有信心
华理附中高中生吴毅凡:在智能领域,中国企业进步极快,但某些核心技术还受制于人,尤其在算法、算力和芯片上。您觉得我们还需要多久可以突破核心技术?
刘志毅:关于核心技术的中美差异,过去近十年时间,AI创新源头仍然来自美国,虽然国内总体论文数量有所增加,但源头性的论文数量以及质量有80%来自于海外,这个层面的差距仍然较大。
如何追赶和何时追上?
第一,AI在应用上已经产生了分化,同样的源头,通过开源扩散到中国以后,因为芯片的策略和数据的关系,应用的场景产生了两个世界的分化:美国互联网与中国互联网,美国产业与中国产业。
第二,对于我们能否追赶和超越,我仍然持有非常大的信心。2000年时,美国NASA(美国航空航天局)发布政策,阻止所有与中国有关的研究者进入其中参观并学习;但2023年,NASA局长说中国人不允许美国参加中国项目是很保守的行为。这种前后态度的反差,以及中国在相应技术上的突破,都存在一个过程。这个时代很像4G时代电信运营商所做的工作。那时中国制定标准,做TDCDMA但做得不好,几年后华为研发了5G、6G,并制定了5G的全球标准,占据了一半以上的专利,有了极大的改变。
我们既要承认现实中中美之间有十年左右的差距,也要看到未必二十年后我们就不能定义下一代通用AI的标准。中国研究者并不缺乏原创性精神,当下亟需我们做的一件很重要的事情是,与数学家、与不同领域技术科研工作者一起合作工作,二十年后必然能看到新的革新和变化。
AI时代边际成本与规模关系不大,但成本上升加剧了竞争
东方财富职员郑烨婕:大模型的边际效益大于边际成本的恒纪元(编辑注:《三体》中提出的一种时代,意味着大地复苏、生命成长)什么时候来临?
朱嘉明:有两个思路,工业时代边际成本只要形成规模,边际成本一定下降。例如,制鞋制造到一定规模边际成本下降。进入到人工智能时代,人工智能的每一个技术都是动态的,与规模无关,边际成本未必一定下降。
如果假定大模型比较稳定,期构造、参数、技术体系不变,只是重复使用,边际成本是下降的。事实上,大模型需要不断迭代。例如ChatGPT5在路上,可能马上就会公布,虽然它的技术透明度很低,可以绝对相信,会超过第4代。当它上升一个台阶之后。当大模型更新,其的边际成本会是上升的。如此导致大模型竞争的残忍性。其硬技术成本也要上升,芯片进入到10纳米以下,成本急速上升,到现在的3纳米和2纳米,成本和价格都已经超出人们的想象。
在严格意义上,当前科技发展的边际成本是在上升,它使得科技竞争变得尤其激烈。在高科技时代,成本还不仅仅是指资本成本,还有人的智商成本、教育成本、团队成本。
上海智慧城市建设三维度:整体性、全方位赋能以及革命性
上海政法学院教师张洁瑶:伟大一定来自整合,请问上海智慧城市建设过程中的整合路径规划是怎样的?
盛雪锋:上海一直走在智慧城市路径上,而且经历不同的阶段,每个阶段有不同的思路和具体推进策略。从目前来看,上海在城市数字化智能化发展上,也有一些比较好的切入点,主要分享三句话。
第一,进一步强化整体性。过去往往是碎片化发展,以医疗为例,过去是挂号智能化,但是看片不智能化,支付也不智能化,而现在是整体性进行数字化创新了。我们现在希望智能化能够整体性的推进、融入到大场景中,而非单独一个点上实现智能化的突破。
第二,特别强调应用更多新技术进行全方位赋能,尽快使用到城市更新、城市建设、市民服务、政府治理等各个过程。目前已发布一些行业报告,如政府应用人工智能做人机交互、材料检阅等,已进入到规模化落地的阶段,在很大程度上体现了上海对新技术的应用非常迫切。2023年,上海市有一个区块链建设重点工程, 这是非常核心、非常基础的内容。
第三,革命性重塑。希望通过数字化智能化的方式引入之后,颠覆市民服务、城市治理、经济生产形式,使原有线性生产流程变成柔性过程,更加体现消费者的需求,我们能够把原有撒在基层做大量重复性劳动的工作人员解放出来,变成数据做基础工作,使更多人从事服务性对接。
未来智慧城市或者城市数字化智能化一定是从整体性转变、全方位赋能以及革命性重塑三个维度切入。
城市更新案例:上海路边电话亭智能升级,可一键智能求助
王勇律师(线上提问):《上海市城市更新条例》出台后,相伴而兴的是人工智能的发展,2024年人工智能对城市更新的关系和影响有哪些?
盛雪锋:城市和人工智能的结合,已经深度开展,无论在城市更新小的范围,还是城市更新大的领域,比如规划领域涉及许多旧城改造或新片区改造,已有许多学者和专家,包括设计院开始从事这方面的工作。他们的依据是什么?同济大学吴志强院士在许多年前就开始依靠人工智能进行区域化设计,会考虑综合绿化、医院、教育等公共事业以及商业配套,而不是靠经验。这就是很好的城市更新中的案例。
城市更新中,也需要进一步考虑市民生活便捷度。上海老龄化程度较高,老年人如何在新的城市里依托新的基础设施,获得更好的生活体验?可以通过人工智能设备,或者将人工智能加载到已有的城市设施中。
2023年上海电信创造了一个很不错的点子并落地实施:将路边老旧电话亭逐步改造成智能公话亭,目前处于1.0初步阶段,未来这样的数字公话亭是物理公话亭,但是里面加载了大量的数字化和智能化的内容,比如老年人可“一键打车”,残疾人、聋哑人可一键求助手语志愿者并获得帮助。这些都是在城市更新里与智能化结合的内容。
普通人可借助AI完成数字化一生,并加强各类学习实践
时尚业主管徐元君(线上提问):在制度层面、法律层面、哲学层面,我们是否来得及做好迎接数字智能时代带来的巨大挑战?普通人该如何在个人有限的领域里做一些准备?
刘志毅:这一轮大模型最早围绕AIGC,从这个角度说,个人所有数字内容、数字记忆是否沿着AI的路径给它完整的记忆?《流浪地球》说“给它完整的一生”。换句话说,作为实体人的记忆内容信息是否给到AI助理,让它完成数字化的一生,记录我们相应内容,这是一种层面。在之前我这边也做过旅游方向的探索,例如与旅游网站,主要是与景点合作,做数字化和导览。在下个时代,虚拟景点和实体景点将结合,形成更深的交互。在单个旅游场景内体会到不同文化,包括以往的公司和故宫、冬奥会都有相应的合作。基于场景的AI技术,还是要看它的设计出发点以及所在的产业。
朱嘉明:就每个个体而言,不考虑年龄差异,当务之急是开始人工智能“扫盲”,学习实践,将数字智能融合到个人生活中。
整理:金梦 李念
【精彩瞬间】
文末链接
文:嘉明 雪锋 劭华 志毅 讲堂听友
图:现场 邢千里 海报设计 夏莉佳 NFT设计 李洁
编辑:李念
原标题:中国大模型企业如何存活?中美差距如何缩短
图文报道
- 手机大模型能否撑起“全村的希望”?2023年,ChatGPT、SD的火爆带火了AI赛道。但现有的AI痛点则是:操作复杂,需要网络,大家对本地AI的呼声越来越高。也因此产...
- AI大模型+电子合同=智能合同?大语言模在大模型技术的加持下,越来越多行业迎来了重塑的可能,市场也格外关注大模型技术的实际落地。那么,当大模型与电子合...
- 人形机器人迈开腿 AI大模型加速跑 上海身高162厘米,体重60公斤,能灵活抓取水杯、搬运箱子的人形机器人将投入智慧物流生产场景中应用验证;密集上新的大模型...