位置:首页历史解密>商汤科技发布多模态通用大模型“书生 2.5”

商汤科技发布多模态通用大模型“书生 2.5”

所属分类:历史解密 编辑:IT之家 访问量:4253 更新时间:2024/1/14 4:41:04

IT之家 3 月 14 日消息,科技于今日发布了多模态多任务通用大模型“书生(INTERN)2.5”,拥有 30 亿参数,号称是目前全球开源模型中 ImageNet 准确度最高、规模最大,同时也是物体检测标杆数据集 COCO 中唯一超过 65.0 mAP 的模型。

据介绍,“书生 2.5”的图跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知理解能力支持。“书生”由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学于 2021 年 11 月首次共同发布,并持续联合研发。

改进方面,“书生 2.5”实现了通过文本来定义任务,从而可以灵活地定义不同场景的任务需求,并根据给定视觉图像和任务的提示性语句,给出相应的指令或作答,进而具备通用场景下的高级感知和复杂问题处理能力,比如图像描述、视觉问答、视觉推理和文字识别等。

在自动驾驶和居家机器人等通用场景下,“书生 2.5”可辅助处理各种复杂任务。

例如,在自动驾驶场景中,可以大幅提升场景感知理解能力,准确辅助车辆判断交通信号灯状态、道路标志牌等信息,为车辆决策规划提供有效信息输入。

▲利用多模态多任务通用大模型辅助完成自动驾驶场景中各类复杂任务

▲利用多模态多任务通用大模型辅助完成居家机器人场景中各类复杂任务

除解决自动驾驶和居家机器人这类复杂问题的能力,“书生 2.5”通用大模型也可解决纷繁复杂的日生活中的常见任务,满足各种需求。

除全图级别的以图生文,“书生 2.5”通用大模型同样可根据物体边框更精细化定位任务需求。

“书生 2.5”同时具备 AIGC“以文生图”的能力。可根据用户提出的文本创作需求,利用扩散模型生成算法,生成高质量、自然的写实图像。

例如,借助“书生 2.5”的以文生图能力帮助自动驾驶技术研发,通过生成各类真实的道路交通场景,如繁忙的城市街道、雨天拥挤车道、马路上奔跑的狗等,生成写实的 Corner Case 训练数据,进而训练自动驾驶系统对 Corner Case 场景的感知能力上限。

“书生 2.5”还可根据文本快速检索出视觉内容。

例如,可在相册中返回文本所指定的相关图像,或是在视频中检索出与文本描述最相关的帧,提高视频中时间定位任务的效率。此外还支持引入物体检测框,根据文本返回最相关的物体,实现开放世界视频或图像中物体检测及视觉定位。

即日起,“书生 2.5”多模态通用大模型已在商汤参与的通用视觉开源平台 OpenGVLab 开源,IT之家附 GitHub 仓库访问链接。

更多文章

  • 商汤:推翻夏朝,建立商朝的缔造者

    历史解密编辑:潮汕小桀标签:商朝,商汤,王朝,夏桀,夏朝,缔造者

    商汤是中国古代历史上的一位重要人物,他是商朝的缔造者。商汤在夏朝末期是一位有权势的贵族,对夏桀暴政感到不满。据《史记》记载,商汤在夏朝担任宰相期间,多次劝谏夏桀,但夏桀不听劝告,反而将商汤贬为奴隶,加重了商汤的不满。商汤在得到一些贵族的支持后,发动了兵变,推翻了夏桀的统治,建立了商朝王朝。商汤上台后

  • 身处风口浪尖,商汤科技长期价值几何?

    历史解密编辑:财联社标签:商汤,吴尚志,人工智能

    来源 | 贝多财经近日,人工智能软件公司商汤(0020.HK)解禁消息再次居于各榜单热度之首。6月30日为商汤解禁的第一天,约有近70%的股份解禁,股价出来较大波动。从交易量看,当天成交量达19亿股,62亿港币,位列腾讯、美团之后,阿里巴巴之前;换手方面,相当于解锁股份已经换手9%。当日商汤也发布最

  • AI软件市场第一,看商汤AI标准化“战绩”

    历史解密编辑:市界投资汇标签:商汤,莱特,ai

    长期以来,由于应用场景高度碎片化,AI行业困于“手工作坊式生产”的窠臼中,标准化生产、大规模量产都是难题。但是AI第一股、AI软件龙头商汤科技,正在用自己的方式,逐步推动AI量产式创新的实现。包含AI软件市场和计算机视觉子市场在内,商汤科技共计斩获了7项“市场第一”。 1936年,航空工程师西奥多

  • 上市圈钱、暴力裁员,商汤科技“画饼”难“充饥”

    历史解密编辑:DoNews标签:裁员,上市,宣扬,科学家,商汤科技

    撰文 | 因 客编辑 | 杨博丞题图 | IC Photo日前,港股上市的商汤发布了2022年的财务报告。财报显示,2022年,商汤科技实现营业收入38.09亿元,同比下降18.97%,归属母公司净亏损60.45亿元,亏损同比减少64.73%。商汤成立于2014年10月,是一家行业领先的专注于计算

  • 商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型

    历史解密编辑:量子位标签:商汤,宇宙,算法,大模型,chatgpt

    金磊 发自 凹非寺量子位 | 公众号 QbitAI国产ChatGPT之战,已然是大步迈进白热化阶段。就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。单单是这个名字,便值得说道一番。商量的“商”,不仅体现了它是商汤自家“商字辈儿”的产品;从整体来看,更是具有商讨、交换意

  • AI大热的背后 商汤科技的“未来”何解?

    历史解密编辑:Daily每日财报标签:ai,日日新,科学家,商汤科技

    2022年商汤科技亏损在收窄,业务结构和收入结构正在不断优化,抗风险能力不断增强。文/每日财报 吕明侠今年,新的产业风口不断到来,比如智能汽车、元宇宙以及ChatGPT带热的AIGC等,都让AI公司有了新的想象空间。现如今人工智能热度持续升温,曾头顶“AI第一股”的商汤科技在资本市场上顺势迎来一波上

  • 商汤的焦虑,元宇宙故事解不了

    历史解密编辑:i黑马标签:商汤,元宇宙,虚拟世界,汤和,sensetime

    来源:连线Insight(ID:lxinsight) 作者:周晓奇 编辑:叶丽丽曾经众星捧月的商汤科技,如今却成为了投资者们的“弃子”。6月30日,商汤迎来首个解禁日,当日解禁股份约占商汤总股本73%。港股开盘后,商汤股价暴跌,收盘时股价仅为3.13港元/股,跌破3.85港元/股的发行价,市值较上一

  • 用大模型解锁生产力,商汤是认真的

    历史解密编辑:虎嗅APP标签:商汤,算法,编程,模态,大模型

    题图 | 商汤 秒画ChatGPT风头还没过,OpenAI就放出GPT-4进一步巩固自己的地位,不仅提高了自身准确度,还融合了多模态模型,既能理解文本语义,也能理解图像或视频含义,让多模态AI再走一步。没人想缺席这场盛宴,国内已经有数十家企业宣布了自己的动作,并相继推出相关产品,除了布局多模态大模型

  • 商汤股价腰斩,是技术缺失还是资本游戏?

    历史解密编辑:财经下午茶标签:商汤,融资,物联网,资本游戏,泡沫化

    近来,商汤可谓是厄运缠身。6月30日是商汤上市前投资者、基石投资者的解禁日,也是商汤戏剧化的开端。当日,一经解禁,商汤股价登时下跌46.77%,市值单日蒸发额高达921.5亿港元,最终,以跌至3.13港元,低于去年发行价3.85港元的价格收盘。股价腰斩变故将有着港股“AI第一股”光环的商汤拉下宝座。

  • 商汤科技业绩不佳,此前高管持续多年“天价薪酬”

    历史解密编辑:奇偶派标签:商汤,徐立

    日前,商汤科技(00020.HK)发布2022年中期业绩报告。数据显示,商汤集团营业收入为14.15亿元,同比减少14.3%;经调整净亏损为25.64亿元,同比显著增长264.9%。今年上半年,智慧商业、智慧城市、智慧生活、智能汽车四大板块的收入贡献占比分别为40%、31%、21%和9%,实现收入分