2024.07.09
本文字数:9465,阅读时长大约15分钟
导读:咱们整理讨论最为热烈6個议题,它们是业界过去1年中最为困惑、最富分歧、同时也是对后世发展最具占卜性根本难题,
来源 |新皮层NewNewThing
记者 |何昕晔、徐弢、吴洋洋、陆彦君
实习记者 |吴一凡
编辑 |吴洋洋
世界人工智能大会〔WAIC 2024〕有大概是有史以来「最年轻」一次展会——也是猎头参会最多一届,
为期3天展会期间,华为、阿里云、腾讯、百度等大厂在展会期间占据最大论坛、展会场地,但是在声量、Follow度上,AI新势力们诱惑更多Follow——新势力既涵盖MiniMax、智谱、百川智能、面壁智能、智子引擎等新创大模型公司,也涵盖快手、生数科技、爱诗科技、Haiper AI、FancyTech等影像生成公司,以及星动纪元、宇树科技、银河通用等机器人公司,
从年纪看,这些公司都是最近两三年才成立,其中很多创业者还有一半身份在大学校园,尤其在人形机器人领域,比方说星动纪元发明者陈建宇,他身份同时还是清华大学助理教授,北大-银河通用联合实验室主任王鹤同时是北京大学助理教授,而穹彻智能联合发明者卢策吾同时是上海交通大学教授,
这些年轻公司、年轻创业者显示由ChatGPT掀起生成式人工智能所处阶段:一切刚刚开始,这里充盈着机遇,也充盈着不确定性,以及「危险」,「新皮层」获得消息称,很多猎头公司派人参与这次展会,猎聘等猎头公司在展览腹地设立展台,猎头们则忙于在各個会场、展台「狩猎」,与此同时很多开设分会场公司都祭出更为严格保安措施,不允许参会者寻求公司高管、产品掌门人们联系方法,有初创公司内部人士对「新皮层」称,他们甚至收紧对外发布新产品节奏,
根据官方公布信息,截至7月6日下午14时,本次人工智能大会线下参观人数突破30万人次,
在这個体感温度高达40度却仍有30万人参与大会中,咱们整理讨论最为热烈6個议题,它们是业界过去1年中最为困惑、最富分歧、同时也是对后世发展最具占卜性根本难题,你会看到大厂如何根据既有立场讲述新轶事,也可以看到新势力如何各显神通奋勉将自己留在牌桌上,
算力难题到底是不是难题,云、端、大模型公司各持己见
高通倡导强化端侧算力,以推动AI深层次应用
高通中国区董事长孟樸称,当前生成式AI研发、应用最先选集中在云端,倘若将20%生成式AI就业负载转移到终端侧,预计到2028年将节省160亿美元计算资源本钱,况且,为推动深层次AI广泛应用,也须要将其本事延伸到日常运用智能设备上,高通倡导在终端侧开发更高性能AI搞定器,并改良生成式AI模型,使其体量更小、效能更高,孟樸感觉伴随小型生成式AI模型质量提高,最后市场能够在终端设备上运行与云端大模型相当、甚至更非常好AI模型,目前,高通已推出第三代骁龙8移动平台,最高可以持助100亿参数生成式AI模型,
华为独创方向是把端侧难题放到云端搞定,降低对端侧芯片依赖
、高通中国区董事长孟樸观点不同样,华为常务董事、华为云总经理张平安在发言中更加着重云端计算在大模型阶段要紧性,他声称,无法把人工智能基石设施放在对最先进制程AI芯片依赖上,端侧算力受限,就应该把端侧算力需求释放到云端,因中国公司在云端持有更强5G网络优点,经由网络上行、下载效能搞定端侧算力难题,
张平安称,目前华为终端设备很多任务都在云端完成,比方说云办公、云拍照、云手机、云游戏、云设计,一個简单例子是拍照,张平安称,华为手机里有多個镜头,运用者拍照时每按一次快门,手机都会拍下至少6张照片,而后算法会经由整合这6张照片最后为运用者供应细节丰富景象,这一整合过程在端侧搞定、在云端搞定结果差异巨大,借助云端算力,多张照片整合后疗效可以更加清晰、立体,
华为已特意派很多项目组琢磨如何把端侧算力需求放在云层搞定,于是维持端侧功能丰富性,又降低功耗、对芯片依赖,「对咱们来说,咱们琢磨独创方向就是别把端侧做得太复杂,」张平安在发言中说,
阿里云发明者王坚说「算力难题是個伪命题」
之江实验室主任、阿里云发明者王坚自称「一個无药可救技术乐观主义者」,今天很多人说中国公司算力是個难题,他感觉这是個伪命题,因「跟〔中国〕现有基石模型相比,咱们应用做得不够好;与〔中国〕现有算力相比,咱们基石模型做得不够好;与咱们现有电力相比,咱们算力还不够」,在这個不等式下,他感觉能源至少不是做人工智能要担心难题,是做基石设施要担心难题,新能源会出现、新算力格局会出现,所有难题都是要在动态过程中搞定,
对于大公司而言,王坚感觉人工智能影响体现在两方面:最先個, 只要是新技术,一定会有新大公司发生,倘若没有新大公司发生,那它是不是颠覆性技术要打個问号,他相信,这個阶段一定会有新大公司出现,就像当年GE一样;第二, 一定会有大公司烈火重生,在他看来,前几天苹果发布会,不是拿人工智能服务C端客户,而是用人工智能技术重新构建公司,从重构它操作系统开始,
王坚称,互联网阶段有草根创业说法,对很多东西依赖性相对少,但是人工智能还是有很多依赖性,比方说数据,这对大公司会友好些,但是大公司面对挑战还是存在,有一個因素容易被忽略,就是人,AI对每個部门都会引发影响,很多大企业要求所有部门所有人都拥抱AI,很难, 王坚感觉,小企业跟大企业根本差别是,「大企业觉得AI是工具革命,小企业觉得AI是革命工具」,大企业也意识到AI是革命工具,那更迭就来,
大模型准确率既是难题,也不是难题
MiniMax发明者兼CEO闫俊杰感觉大模型准确率是個难题
ChatGPT发布已有一年半,距离GPT-4发布也已过去1年,这一年多,国内很多公司都推出号称「对标」GPT-4国产模型,但任凭GPT4还是国产对标它模型,都没有真正大规模进入生产力领域供应协助,而依旧停留于娱乐功能,在如何才干突破这一困境难题上,MiniMax发明者兼CEO闫俊杰、智谱AI CEO张鹏给出不同样观点,
MiniMax发明者兼CEO闫俊杰感觉,大模型目前最重心难题还是模型错误率较高,比方说GPT-4在很多测试指标上大概正确率只有60%、70%,意味着有30%至40%错误率,大模型产品多采纳对话格局,就因对话容错率较高,每一步30%、40%错误率,多步错误率就更高,由此构建Agent就无法运用,
闫俊杰感觉,降低大模型错误率,使其从30%至40%降到3%至4%、甚至2%,错误率降低一個数量级,是让AI从辅助人类工具到独立完成就业最重心地标,这须要综合性搞定方案,做合成数据、提高训练效能、研究比Transformer更非常好新型网络结构、研究各类新算法、做更非常好对齐,所有这些技术加在一起,也许能够让业界半年或者一年之后获得一個错误率個位数模型,
MiniMax发明者闫俊杰〔中〕与智谱CEO张鹏〔右〕,
智谱AI CEO张鹏感觉急需搞定难题不是大模型准确率,而是多模态输入
但是智谱AI CEO张鹏不感觉提升正确率是搞定大模型应用难根本,他以上一代AI——人脸识别为例,表达它在准确率指标上已经超过人类水平,但大家依旧觉得那不是人工智能终级答案,「准确率是一個方面,一般而言,准确率大多数限定在一些评测集或者任务上量化评测,但有些东西很难量化,比方说人逻辑性、抽象琢磨本事,」张鹏说,
他感觉,后世大模型须要更像人,先说在信息输入方法上更像人,人在现实世界中搞定难题所须要输入是多模态信息,除自然语言还有视觉、听觉、触觉,因为这個突破大模型应用瓶颈也在于先搞定好多模态难题,他打個比方称,运用者希望大模型帮忙扫地、做饭、洗衣服,这些任务所须要输入信息都应该是多模态,这些方面本事突破会带来AI普惠,
自动驾驶:端到端是共识,但市场验证、运用者体验难题都还没搞定
在「智能驾驶前沿洞见」圆桌对话环节,同济大学汽车学院教授朱西产、嬴彻科技CTO杨睿刚、上海交通大学人工智能学院教授严骏驰、光轮智能发明者兼CEO谢晨等几位专家就端到端模型后世、可解释性、如何验证等话题展开讨论,
光轮智能发明者谢晨感觉,汽车公司「应该百分之百拥抱,且一定要最激进地去做端到端,倘若一個公司没有做端到端本事,我感觉它不应该存在,它很有大概会被淘汰,」他感觉从产品体验角度来看,端到端最根本点不是保障性,而是它更加像人,这是商业化必经一個点,况且,端到端技术是符合scaling law〔规模定律〕,〔注:端到端模型由特斯拉提出并最新实践,它意味着自动驾驶系统须要用一個独立神经网络去学习驾驶环境并自主「做出决策」,过去,多数——尤其L2级及以下自动驾驶方案都将感知与决策分开,同时决策是根据工程师预先编写应对策略库作出,〕
端到端模型面对着无法解释性难题,但是谢晨感觉,人做很多事情也很难百分之百推理出现,讨论无法解释性更多是因人类对AI不信任,极具信任AI以后,可解释性就不再是個难题,同济大学朱西产教授则持反对意见,他感觉「任何时候都要可解释」,
圆桌中得到一致认同观点是「端到端模型验证是现阶段根本难题」,
特斯拉运用「里程覆盖」这一指标体现智驾本事,根据马斯克说法,当运用者里程数达到20亿英里,智驾级别从辅助级变为监督级〔注:特斯拉没有运用通用L1-L5分级,而是根据辅助级、监督级、自动级来划分自动驾驶本事〕,
圆桌嘉宾感觉,单纯地看「里程覆盖」并非合理,因光说里程不看场景是没有用,在没人、没车地方跑再远,意义也不太,还是得回到场景,奠定场景库,「怎样场景测试才算详尽,任凭是学术界还是业界,都在探索之中,」嬴彻科技CTO杨睿刚说,
光轮智能发明者谢晨更加看重车企持续获取数据本事,而不是里程数或场景数,「我问过特斯拉内部人员,车辆数达到多大规模时可以感知到数据闭环本事,他们回答说上千万级辆,比方说改完算法,晚上推给欧洲车队,第二天早上就能拿到欧洲运用者回环结果,这才是真正数据本事,」谢晨称,特斯拉已经过训练数据阶段,他们希望持有把一個corner case〔边角案例〕泛化成一万個corner case本事,当你发现一個司机拐弯发生难题,你不会从逻辑上找原因,而是会让他过更多弯,再以此判断他是否是一個好司机,这也可以避开可解释性难题,
特斯拉FSD〔Full Self-Driving,全自动驾驶〕还没有正式进入中国市场,杨睿刚、谢晨共享他们试驾体验,杨睿刚称,相较于FSDv11,FSDv12对司机注意力要求大大提升,虽说技术水平在提高,但個人体验达到某個层面后是下降,「开V11时候,在高速上手基本可以随便放,现在〔指FSDv12〕不看路超过3秒,一定报警,」谢晨也有类似体验,他表达「还是因特斯拉太自然,太自然,我就想脱手」,他对特斯拉FSD后世在中国渗透率表达乐观〔进一步阅读有关特斯拉市场渗透率评估可移步《 》〕,
同济大学汽车学院教授朱西产提到NOA〔Navigate on Autopilo,领航辅助驾驶〕产品能否大行其道,要看明年欧盟最后颁布法规允许脱手、脱眼时间是多少,「倘若达到15秒还好,倘若是10秒,那买NOA系统钱就白花,开传统车脱手时间也能达到这個水平,」他说,
影像生成:运用者对工具没有忠诚度,老平台大概才是受益者
整個WAIC大会期间,有关影像生成话题在多個分会场中都是话题腹地,其中一场以影像生变成主题论坛邀请五源资本副总裁石允丰、FancyTech〔阶段涌现〕发明者兼CEO空界、美图集团高级副总裁陈剑毅、井英科技发明者、CEO朱江 、Haiper AI联合发明者兼CEO缪亦舒、Morph AI发明者兼CEO徐怀哲等多位影像生成领域创业公司加入,
作为风险投资人,五源资本副总裁石允丰一直在探寻AI领域机遇,他发现,影像生成技术在过去一年有很大更迭,起初,他感觉这一技术大概带来移动互联网阶段抖音、快手之后下一個大流量平台,但现在他感觉影像生成技术更大机遇大概在实体世界应用,如机器人、自动驾驶,这些领域倘若能持续占卜并奠定物理世界小模型,将搞定很多难题;反过来,影像生成技术大概很难对新平台诞生引发协助,因其消费价值百分之百被老平台〔抖音、快手等〕捕获,
影像生成内容目前在公共领域中消费价值还很低,石允丰感觉,当前影像生成技术还处于早期阶段,类似于GPT-2刚发生时情况,在不定鼎技术基石上探寻产品市场契合点〔PMF〕非常具有挑战性,挑战之一是运用者忠诚度,他发现,Luma AI发布最新模型Dream Machine 4天内获得1000多万运用者,这些运用者之前应该都用过Runway、Pika,
石允丰感觉,虽说有些应用能火速诱惑运用者,但倘若没有有效变现手段,这些运用者增长并未实际意义,相反,相较于高复杂度应用,图生表情包、鬼畜影像等简单应用短期内看起来更work,
Haiper AI联合发明者兼CEO缪亦舒在共享中同样着重影像生成对于AI学习价值,「影像生成不光是技术难题,它还涉及到感知、理解世界方法,」缪亦舒说,人类学习是多模态,涵盖视觉、听觉、阅读、动觉,而影像生成技术是模拟这种多模态学习一种方法,这一说法与智谱CEO张鹏观点相似,他们都感觉,多模态输入、学习可以让AI学会更多东西,因人就是这么学习,而不是只学习语言或任何一种单一模态,
影像生成理想很丰满,现实很骨感,FancyTech〔阶段涌现〕发明者兼CEO空界同样对这一结论深有体会,他2019年创立FancyTech也主打影像、数字人生成,最先选服务于To B市场,协助商家生成基石素材,尤其是替代传统基石拍摄一部分,
空界感觉,在国内大模型领域创业有3种视角:其一是做适合当地市场国产模型;其二是做对标OpenAI尖端模型,一开始就面向全球市场;最后一种是像FancyTech这样,先务实地经由AI业务先有进账,保证留在牌桌上,「PMF不是一天找到,刚开始一定要聚焦,留在牌桌上也很要紧,」空界说,
一些公司已经将影像生成技术用于短剧、游戏等产业 ,以「开发下一代AI娱乐超级应用」井英科技已于去年推出海外最先個AI短剧App——Reel.AI,让运用者可以用AI生成短剧,井英科技发明者兼CEO朱江称,他相信AI将重新定义娱乐体验,使影像不光是观看对象,还能互动、参与,Reel.AI根据井英科技自研模型开发,朱江感觉,AI技术升级或者发展是不连续性,大概突然发生技术成熟阶段,催生新型娱乐应用、媒介,因为这個,对技术透彻理解、火速调整战术方向对这一代创业者至关要紧,
游戏是個内容密集型行业,AI技术大概重塑这一产业从从立项到研发再到面向玩家各個阶段,盛趣游戏也正在探索将AI技术融入其游戏研发流程,盛趣游戏技术腹地AI掌门人李锋称, 影像生成技术确可以协助设计者更生动地表达、理解游戏概念,但是他们更加想要不是AI直接生成影像,而是希望它能生成影像背后数据,这样游戏公司就可以经由游戏已有渲染技术将数据实行出现,这样能对最后镜头更加可控,
涵盖Runway、Sora在内影像生成产品为影像创作带来革命性更迭,但是美图集团高级副总裁陈剑毅称,他们发现「普通运用者并非关心影像是否由AI生成,他们更看重内容诱惑力」,而AI目前在协助运用者表达情感、记录生活方面作用还有限,对于普通运用者来说,AI影像生成目前价值在于让一些难以实拍场景变得易于获取,比方说自然现象模拟,AI可以让缔造者低本钱获得极光、冰川融化场景,但是陈剑毅也感觉,AI影像生成颠覆性在短期内大概被高估,从长远来看,它影响大概被低估,后世,AI影像生成大概让每個人都能在虚拟世界中得到一种格局永生,更要紧是,AI技术可以协助更多人克服对镜头恐惧,
整個论坛中,很多发言者都感觉影像生成技术目前仅相当于语言模型GPT-3甚至GPT-2阶段,新加坡南洋理工大学助理教授刘子纬感觉其中一大阻碍是业界还没能找到「影像生成最先個定律」,「语言模型scaling law可以让业界明确投入多少资本、资源就可以实行多大层次智能,而多模态领域scaling law还没找到,」他说,
人形机器人ChatGPT时刻何时到来?
人形机器人在本次WAIC上赚足Follow度,走进世博展览馆就能看到一個巨大人形机器人阵列,18台来自不同样企业、机构人形机器人组成「十八金刚」集体迎宾,人形机器人展区也人头攒动,除还在柜子里特斯拉擎天柱Optimus,傅利叶、星动纪元、宇树科技、达闼等多家公司都开放性地展示各自人形机器人产品,星动纪元XBOT双手灵活,能够精准高速地做出夹、捏、握、拧等动作,还会点赞、比耶,
具身智能、人形机器人都是近年才被普及到大众层面新概念,倘若要具备身体智能,什么样机器人形态是最优?所有公司都认同类人形态在数据获取方面更具价值,因只有像人一样行动,才有大概实行类人级别智能;况且,最后若要像人一样服务千行百业、实行通用,那么它最卓著体形也像人,
但是并非所有厂商目前都将产品做成百分之百与人相同人形,比方说北大-银河通用联合实验室,其最先款机器人上半身与人类相似,只是双手并非人类那样五指,而是左吸盘、右抓手,这样方便机器人在商用货架上就业;另外,其机器人下半身并未像人那样双腿,而是做成可移动底盘,因「现在机器人硬件技术还做不到让机器人在弯腰、蹲、跪同时手部还能操作,现在做不到,」北大-银河通用联合实验室主任王鹤解释说,后世等这些难题搞定,他们也会「拥抱」人形,
根据大会官方信息,今年WAIC展览现场共有56款具身智能产品领先上市最先秀,智能机器人42款,其中人形机器人22款,就便都是人形,展会上「十八金刚」关节模组、自由度以及布置方案也不同样,宇树科技最先席运作官陈立感觉,后世会有一到两种方案脱颖而出,形成一個准则硬件载体,
硬件准则收敛对于机器人训练本钱密切相关,迈柯博商务总监魏昌说,本钱也是很大难题,Google过去花1700万美元训练一個厨房场景大模型数据集,但「咱们发现,倘若把厨房台面高度稍微做些更改,花1700万美元训练数据集、大模型接近没有用,」
、影像生成一样,具身智能领域ChatGPT时刻也尚未到来,甚至更为早期,倘若发布Demo是一個行业0到0.1阶段,那0.1到1过程就是POC〔Proof of Concept,概念验证〕,星动纪元发明者陈建宇感觉,目前大一部分具身智能公司处于这個阶段,大概明年一一部分公司会完成POC验证,
如何让机器把读万卷书、行万里路知识结合起来还是個难题,目前,业内普遍把具身智能背后算法分为high-level policy、low-level policy,就所谓大脑、小脑,大脑负责感知、决策,小脑负责执行,星动纪元发明者陈建宇感觉,一個大小脑融合端到端架构更有价值,因他们最近发现,在一個很大模型上面,倘若想把物理层面数据反馈给大语言模型疗效并非好,「这個也是最近英伟达提出现叫作RLPF〔Reinforcement Learning from Physical Feedback,根据物理世界反馈强化学习〕概念,区别于RLHF〔Reinforcement Learning from Human Feedback,根据人类反馈强化学习〕语言模型,是一個很有意思难题,」陈建宇说,
银河通用Follow人形机器人小脑一部分数据获得,他们发现,现有很多操作本事都是靠遥操来实行而非经由自主学习,比方说特斯拉Optimus,他们用40個人团队遥控人形机器人采集数据,过去一年,银河通用在合成数据方面投入很多精力,他们用10亿合成数据训练出现抓取技能成功地在透明、金属高反光、各类柔性、刚性物体中泛化,
中美博弈方面,不同样于语言模型上美国同行绝对优点,星动纪元发明者陈建宇感觉,中国公司在人形机器人方面与美国差距不会太大,因「具身智能=机器人+AI」,美国AI强,但机器人更着重供应链,中国在机器人供应链上更强,软件出现后,很能就能把软硬件结合做出现,
大厂有哪些新发布?
可灵「最先尾帧」功能也上线,图像模型可图宣布开源
7月6日,快手在WAIC 2024论坛活动中发布多项多模态模型更新,影像生成模型可灵网页端正式上线,模型新增最先尾帧控制、镜头控制等功能,目前单次文生影像时长增加至10秒,另外,快手宣布开源图像生成模型可图,
可灵于今年6月6日上线,是快手自研影像生成大模型,也是目前国内最先個個已上市类Sora影像生成模型,目前,运用者可以经由快手旗下创作工具「快影」App测试,6月21日CVPR会议期间,可灵新增图生影像、影像续写等功能,静态图像可生成5秒影像,影像续写可延伸至约3分钟,
这次更新中,可灵模型上线新功能涵盖最先尾帧控制、镜头控制,最先尾帧控制持助运用者上传影像最先帧、尾帧图片,模型就可补全影像中间内容;可灵镜头控制功能则持助任意镜头运动轨迹,目前产品上线水平运镜 、垂直运镜等6项定制运动控制方法,每一项控制方法参数都可调节,参数越大,运动幅度则越剧烈,快手高级副总裁盖坤介绍,目前已有超过50万运用者申请可灵内测资格,影像生成数量达700万,
可图是快手今年5月发布自研图片大模型,参数规模为10亿级,持助文生图、图生图,在本次论坛中,快手宣布可图将正式开源,
快手AI商业产品掌门人刘逍称,相比今年1月,快手6月AIGC相关内容月活跃客户数增长8倍,月GMV规模提升64倍,平台AIGC广告进账规模提升12倍,盖坤称,今年6月,快手AIGC营销素材单日消耗峰值突破2000万,大模型在商业场景中表现出潜力,
商汤科技发布「日日新5o」,对标GPT-4o
7月5日WAIC 2024上,商汤科技宣布「日日新5.5」体系升级,发布对标GPT-4o是「日日新5o」,
是OpenAI近年5月发布多模态模型,可以看运用者所看、听运用者所听并能与运用者实时就所看所听内容交流,
现场演示环节,商汤就业人员、「日日新5o」打招呼,它可自动识别出就业人员佩戴胸卡带子上地标,判断发生场就是世界人工智能大会会场,还可以根据指令火速向在场观众问好,但是,与GPT-4o丰富情绪更迭、能够随时切换任何口吻语调相比,「日日新5o」语气非常平静,没有任何情绪流露,
「日日新5o」现场演示,
功能方面,「日日新5o」能够识别毛绒玩偶外表、穿戴并给出解读,也可以辨别就业人员画简笔画兔子,打开书任意一页,它也能识别图文内容并做总结,但是相比之下,GPT-4o不光能识别文字、人物,还能经由摄像头理解纸上数学题,给出解题指导,这对模型逻辑、推理本事要求更高,
另外,商汤科技还在WAIC期间推出可控人物影像生成大模型Vimi,运用者上传不同样角度人物照片,Vimi可自动生成时长1分钟影像,影像中人物表情、肢体动作、头发都可以活动起来,运用者可以用Vimi制作表情包、影像素材、数字分身等,目前,Vimi已在商汤科技官网开放预约,后世将百分之百开放给C端运用者,
阿里达摩院推出AI影像创作平台「寻光」
7月5日,阿里达摩院在WAIC 2024论坛活动上发布一站式影像创作平台「寻光」,寻光是一個针对影像创作者推出工具性平台,产品意向是创造AI阶段全新影像就业流,寻光将AI本事加入影像创作全流程,从剧本创作、分镜设计到影像素材编辑,创作者都可在该平台完成,阿里达摩院影像生成掌门人陈威华称,「寻光」使得影像编辑过程像做PPT一样简单,寻光平台目前处内测阶段,
面壁智能发布端侧AI应用开发平台Mobile CPM
借助阿里云在WAIC 2024期间举办论坛,面壁智能发布一個叫Mobile CPM套件平台,开发者可以经由这一平台供应SDK套件「一键开发根据端侧大模型App」,面壁智能最先席科学家 刘知远在发布会中称,该平台接入「非常多端侧通用模型」,
面壁智能此前已发布多款适用于小型智能设备端侧小模型,6月11日苹果开发者大会上,苹果提出Apple Intelligence概念,将后世运用者在端侧体验到AI搞定方案划分为端侧、云端两层,其中云端接入GPT等第三方模型,端侧最先选运用苹果自研小模型,
面壁智能CEO李大海对「新皮层」称,后世端侧模型是外部厂商供应还是设备厂商自己做是個开放性难题,目前「大家还在探索」,而作出高品质端侧模型并非简单事,倘若设备厂商选择自研,意味着他们也要像国内最先個梯队基石大模型初创公司那样配备「100人起,重心至少也得大几十人」AI团队,
面壁智能计划在2026年年底推出GPT-4水平端侧模型,「到那個时候咱们对端侧模型、云端模型就业划分就不会是现在这個状态,到时候有很多相对难一些事情也可以在端侧做,」李大海对「新皮层」说。
微信编辑| 格蕾丝