位置:首页历史解密>用大模型解锁生产力,商汤是认真的

用大模型解锁生产力,商汤是认真的

所属分类:历史解密 编辑:虎嗅APP 访问量:1033 更新时间:2024/2/29 10:57:18

题图 | 商汤 秒画

ChatGPT风头还没过,OpenAI就放出GPT-4进一步巩固自己的地位,不仅提高了自身准确度,还融合了多模态模型,既能理解本语义,也能理解图像或视频含义,让多模态AI再走一步。

没人想缺席这场盛宴,国内已经有数十家企业宣布了自己的动作,并相继推出相关产品,除了布局多模态大模型,他们的目标也一致指通用人工智能AGI,旨在改变千行百业。

眼看国内产品一个接一个地落地,市场密切关注早就深耕AI领域的商汤的动态。4月10日,商汤分享了以“大模型+大算力”推进AGI(通用人工智能)发展战略布局,并公布了商汤在该战略下的“日日新SenseNova”大模型体系,那么,它究竟靠谱吗,又能为我们做什么?

从GPT到人机共智

市面上并不缺乏类ChatGPT产品,有些公司借风起势,有些公司用AI武装自己现有的产品,伴随着AI越来越被人触手可及,越来越多人开始发问,号称“胡说八道”生成器的这些产品究竟有什么用,全行业是否在进行一场作秀式狂欢。

事实上,以GPT-4为首的多模态大模型是AI走进千行百业前的一个节点,AI大模型是AI的第二次革命,从2012年开始,AI就是以深度学习不断突破应用的工业红线,并在每个垂直领域都出现“AI+场景”这样的应用,但每个场景都去做一个模型,不仅需要投入大量时间,还需要投入大量的成本。

通用AI大模型则能为AI范式带来变化,利用它可以以极低的成本和极高的效率,迅速覆盖千行百业,实现人机共智,这也是商汤为不遗力地投入到大模型这件事。

再以编程领域来看,事实上,现阶段开发人员存在许多枯燥的重复性工作,占用了大量更富有创造性的编程工作或是代码设计的时间。假若将GPT与编程相结合,让AI承担这些工作,就可以让开发人员拥有更多时间去创造对人们更有帮助的应用。

又比如说在短视频或广告领域,许多人拥有丰富的创意,但碍于缺乏美术功底或专业能力而很难将自己的设想变成现实。而在AI加持下,只需对它详细描述自己的创意,就能快速生成各种优质内容,极大地提高效率,让有才能的人不再被埋没。

当然,想要覆盖上述场景或更多天马行空的应用,视觉、文本、音频必须融会贯通,就像赋予人视力、听力,感知和理解地更多,才能更好地帮助产业化发展,而这就是行业所说的多模态,也是GPT-4所布局的重点。

据统计,人类文明产生的高质量语料数据共约为9万亿,随着语言模型消耗的数据量成倍增长,很快就会面临着高质量语料被消化完的局面。相比起来,人类80%的信息是通过眼睛获取的,人的神经元处理视觉和语言连接数比例是10:1,因此当GPT-4加入图像识别能力,就拥有了一图胜千言的能力。

对比国内国外在大模型领域上的布局,虽然存在差距,但实际并非遥不可及。大模型依托的是算法、算力和数据,只要掌握了这种能力,剩下的就是时间问题。

就比如说,让大模型去写故事,第一次可能并不会写出很优秀的作品,但如果跟它互动,自己一句,大模型一句,在不断训练过程中,它就能慢慢变成一个有趣有料的AI。又比如说,在向大模型提问时,可能不会直接给出正确答案,但在中途不断发它,它就会逐渐学会答题的推理过程,从而越答正确率越高。

优秀的大模型就像有天赋的运动员一样,不需要一招一式地手把手教学,只要输出方法论和恰当的引导,就能够学会甚至创造新的动作。如果是资质平庸的大模型,通过勤奋和努力也能够达到一定水平,但这意味着需要更多教学时间。

相比英文,中文不仅更难理解,迄今为止的语料库也稍显逊色,如何将不同类型的语料知识融合,如何将不同领域知识调和出最佳性能的完美配比都将是国内相关企业需要面对的问题。那么商汤的“日日新SenseNova”能够解决这种问题吗?

造出来 用起来

本次,商汤推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

技术日当日,商汤选择使用现场演示的方式展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用的情况,根据商汤的介绍,千亿参数的大语言模型未来主要面向B2B业务。

语言大模型应用平台“商量”,可以编故事、做心灵指导、解读PDF文档、理解中国传统文化,可以在医疗领域做导诊、问诊、健康咨询,还能在开发领域作为编程助手自动进行程序生成。

秒画、如影、琼宇、格物等生成式AI应用则成为短视频、直播产业的得力助手。通过秒画可以创作高质量的艺术作品;通过如影能实现高质量、无门槛、多风格的数字人创作;通过格物、琼宇可以实现高效、可交互、可编辑的物体和场景生成及漫游。以上这些人、物、环境,都可以在数字空间中无缝连接。

商汤在此前更多是在B端服务客户,如自动驾驶、智慧城市,商汤认为,AI或大模型发展最本质的是要解决生产力的进步问题。

比如说,在企业中,HR的简历分析筛选工作可以通过AI大模型快速完成;在自动驾驶领域,可以为数据闭环构建和半自动标注能力挖掘等方面提供帮助;在科研领域,无论是蛋白质药物研发,还是挖掘未来新材料,大模型技术都是必需的;在编程领域,接口编写、测试用例编写等枯燥编码工作都可交给大模型,未来程序员可以转向创意型或架构层面设计。

现在,商汤的大模型已覆盖公司核心业务,在智慧城市、智慧商业、智能汽车和智慧生活四大板块20多个场景实现了扎实的落地。借由现阶段的大模型体系,商汤正走向更远的AGI(通用人工智能)时代。未来商汤的通用人工智能大模型体系会覆盖视觉感知、语言理解、内容生成和推理决策四大方面。

一脉相承的技术

事实上,商汤发布大模型并非意料之外,而是一脉相承。作为一家成立之初,就紧密围绕AI作为主要业务的公司,而现在,八年技术沉淀,商汤有能力做,也必须追随现在的热点做大模型。

2019年,商汤就首次发布10亿参数视觉大模型。2022年,商汤发布320亿参数视觉大模型,是世界上迄今为止最大的视觉模型。同年,商汤研发出10亿参数的AIGC模型,能够支持文生图和图生图的各种功能。前不久,商汤开源了书生2.5,是拥有30亿参数的多模态模型。不同的模态的技术积累,促使商汤训练一个更加强大的多模态大模型。

大装置是商汤能够做好大模型的基础。业界普遍误认为商汤没有云,事实并非如此。早在2020年开始,商汤就在上海临港建设架构最大的人工智能的算力中心AIDC,2021年底竣工,2022年初开始投入使用。而到2022年的9月商汤正式发布了商汤AI大装置,它通过AI原生的云化基础设施对外提供服务。

AI大装置提供了支持大模型生产的一系列服务:一是提供处理大模型需要的自动化的数据标注,使标注效率提升百倍;二是大模型的推理部署,使得推理的效率可以提升100%以上;三是大模型的微调和增量训练,让给定大模型可在原本1/10成本下运行在商汤大装置上;四是附有一系列开源模型和开发者工具,使得开发者效率大规模提升。

要研发出优秀的模型,数据必不可少。商汤在众多行业内积累了丰富的高质量数据,也根据客户要求对这些数据进行各种各样任务标注。此外,商汤也向社区发布了用于真实感知、重建和生成的多模态数据集OmniObject3D,包含190类6000个物体, 可用于AIGC、渲染、大场景重建、物体重建等一系列产品技术中。

模型再好,没有经过千百万次的锤炼终归也只是初出茅庐的菜鸟,通用人工智能时代,模型参数量剧增,过往10年,最好的AI算法对于算力的需求增长超过了100万倍。但衡量算力能力和核心指标不是简单的数字,一方面是多卡并行状态下的有效利用率,即能够支撑大模型训练的实际算力;另一方面是系统能够持续稳定运行的时长。

现在,商汤SenseCore AI大装置可提供5000Petaflops算力,能够以最大4000卡规模集群进行单任务训练,可以训练参数量超5000亿的稠密模型,并做到七天以上不间断的稳定训练,今年的目标是能够在大装置上训练超过万亿参数的模型。

对于大模型的商业化,商汤有着自己的理解。商汤做了一整套工具、产品和解决方案,推进AI领域向全新大模型范式发展,把原本零散且定制化难的小作坊式的AI,变成了集中式且支持大规模应用生产的范式,让AI生产成本和应用成本急剧降低。

“从百亿参数到千亿参数到后面万亿参数,商汤的AI大模型每一步都可以用在实际的行业和产品里。通过飞轮效应的闭环,一来可以把模型越做越大,二来可以把模型越做越有用。”商汤科技联合创始人、大装置事业群副总裁陈宇恒对大模型的商业价值这样解答道。

不仅如此,商汤持续维持高比例的研发投入,2022年报中显示,商汤研发支出合计40亿元,同比增长11%;研发人效相比去年进一步提高90%,人均每年研发模型数9.35个;累计商用模型数提高了93%至6.7万个。

“苟日新,日日新,又日新”,技术日上,商汤不断强调这句出自儒家经典《礼记·大学》的名言,意为如果能够一天新,就应保持天天新,新了还要更新。这就像“日日新”大模型体系给产业带来的全新的生产力革命,在商汤科技已经将AGI的服务沁入企业生产及生活中,悄然掀起了一场生产力的革新风暴。

标签: 商汤算法编程模态大模型

更多文章

  • 商汤股价腰斩,是技术缺失还是资本游戏?

    历史解密编辑:财经下午茶标签:商汤,融资,物联网,资本游戏,泡沫化

    近来,商汤可谓是厄运缠身。6月30日是商汤上市前投资者、基石投资者的解禁日,也是商汤戏剧化的开端。当日,一经解禁,商汤股价登时下跌46.77%,市值单日蒸发额高达921.5亿港元,最终,以跌至3.13港元,低于去年发行价3.85港元的价格收盘。股价腰斩变故将有着港股“AI第一股”光环的商汤拉下宝座。

  • 商汤科技业绩不佳,此前高管持续多年“天价薪酬”

    历史解密编辑:奇偶派标签:商汤,徐立

    日前,商汤科技(00020.HK)发布2022年中期业绩报告。数据显示,商汤集团营业收入为14.15亿元,同比减少14.3%;经调整净亏损为25.64亿元,同比显著增长264.9%。今年上半年,智慧商业、智慧城市、智慧生活、智能汽车四大板块的收入贡献占比分别为40%、31%、21%和9%,实现收入分

  • 亏损加速、股价新低!商汤科技“熊途漫漫”何时到头?

    历史解密编辑:证券之星标签:商汤,股价,漫漫

    9月29日,港股商汤科技高开2.89%,随后震荡下跌,收盘前20分钟跌幅一度超过8.5%,最终报收于1.63港元,跌5.78%,盘中曾创下1.58港元的上市以来新低。从创下上市最高点的2022年1月4日起算,商汤的跌幅已经超过78%。商汤上市以来为何跌势难止?主营AI业务连续五年亏损 研发投入占比巨

  • 商汤股价一天腰斩,巨额研发没能带来利润

    历史解密编辑:晚点LatePost标签:商汤,股价,上市,股票

    商汤科技市值已经来到千亿港元的位置了 —— 6 月 30 日暴跌 46.7% 以后。合理解释之一是天量限售股解禁。根据商汤招股书和东方财富 Choice 汇总的数据,商汤股东手里大约 234 亿股股票在 6 月 30 日解除锁定、可以卖出。这些股东包括上市前股东、港股基石投资者,以及商汤管理团队。解

  • 对话商汤首席科学家王晓刚:AI 大模型只强调“大”是严重误导

    历史解密编辑:雪豹财经社标签:商汤,书生,ai,王晓刚,大模型,埃隆_马斯克

    万模之战,意义何在作者| 黄鹏封面来源| 摄图网商汤科技内部有一个略显神秘的部门:人工智能伦理与治理委员会。去年,他们发布了《智能伦理治理年度报告》,提出AI的发展应“负责任且可评估”,并制定了内部监管要求。这像是提前回应了年初马斯克等人呼吁暂停AI研究的言论。当国内企业竞相投入大模型研发时,商汤已

  • 突发!暴跌45%的商汤科技到底估值几何?

    历史解密编辑:蓝科技标签:商汤,股价暴跌,股价,市销率

    【蓝科技观察】6月30日港股市场上惊起一片哗然,市值2000亿元的“AI独角兽”商汤科技(商汤-W 00020.HK)盘中直线跳水式暴跌,截止当天收盘,跌超45%,市值一日内缩水至1049亿,收盘价为3.130港元,整日成交量为19.03亿股,成交额近62亿,换手率为5.68%。商汤科技作为号称“A

  • 商汤牢狱之后的浴火重生

    历史解密编辑:雾里五里标签:商汤,伊尹,孙武,夏桀,诸侯,牢狱,昆吾氏

    商汤经历牢狱之灾之后,改变了战略,有那种老骥伏枥的感觉,确切的说应该是蛰伏,以待时机,然而,你的思想不能决定别人的行为,何况对比夏桀还是如此的鲜明,你觉得低调,别人可不这么认为,于是出现了一个戏剧性的画面:许多诸侯竟然慕名前来归附于他,这是因祸得福还是福祸相依,谁知道呢不得不承认,伊尹对此功不可没,

  • 加入AI大战,商汤科技浴火重生?

    历史解密编辑:全天候科技标签:盘古,书生,宇宙,科学家,商汤科技,ai大战

    在这股AI大模型的风口中,5年亏损超438亿元的商汤科技,抢到了先机,推出了自研的AI大模型体系,站到了与阿里、百度、华为等巨头同台竞争的位置。但要成为中国版Open AI,商汤还差多远?作者 | 胡描 编辑 | 罗丽娟发酵了一个季度,年初被ChatGPT引爆的AI大模型,在近期迎来了集中爆发。被誉

  • 大装置+大模型加持,商汤驶向智能汽车深水区

    历史解密编辑:紫金财经标签:商汤,哪吒,算法,大模型,智能汽车,国际标准

    (本文系紫金财经原创稿件,转载请注明来源)犹如当初进入“电气时代”一般,身处历史变革之中的人们,难以想象这将是一场多方向的技术革新。电的广泛应用,从千家万户到产业格局日新月异,甚至多次影响历史发展的方向和脚步。AI问世之际,颇有几分电气时代变革初期的味道,人们惊讶于技术革新的同时,也在思考其最终落地

  • 商汤公布2022“成绩单”:多个领域蝉联市场桂冠

    历史解密编辑:证券日报标签:商汤,智能化

    近日,IDC发布《2022上半年人工智能及软件市场追踪报告》,报告显示,商汤科技位居中国AI软件市场首位,成为市场领导者。同时,在关键的计算机视觉子市场,商汤连续六年蝉联桂冠,整体市场份额占比达20.7%,超过第二名到第四名之和。不仅如此,商汤在2022年还获得了诸多第三方权威市场分析师机构