大模型激战半年,腾讯字节姗姗来迟
来源:时代财经APP(ID:tf-app) 作者:谢斯临
(资料图)
王小川进击、王慧文退场。
国产通用大模型的混战远未结束。在半年左右的蛰伏期过后,大部分玩家都浮出了水面。
在这之中,有人加速迭代。8月8日,由搜狗搜索创始人王小川创立的百川智能发布了旗下第三款大模型产品 Baichuan-53B,背后训练参数高达530亿。此时距离王小川宣布进军大模型战场不过4个月的时间,这家创业公司进展神速。
这还只是一个开始,百川智能方面向时代财经透露,后续还会有多款产品发布,包括规模更大、参数超千亿的大模型。
也有人黯淡退场。由美团联合创始人王慧文创立,吸引源码资本、五源资本等知名VC机构,以及美团创始人王兴、快手创始人宿华等互联网大佬投资的光年之外,曾一度被市场认为是国内大模型战场上最强有力的玩家之一。
然而,随着6月下旬王慧文因健康问题离岗退出,无法继续执掌光年之外,这家备受期待的大模型创业公司只能卖身美团,一众投资人也随之退股。
还有人另辟蹊径。
AI大牛周明创立的澜舟科技,强调轻量化模型,希望用更低的成本解决B端场景问题。而曾帮助谷歌将BERT模型的训练时间从3天降到76分钟的新加坡国立大学校长青年教授尤洋,则成立了潞晨科技,试图用低成本训练大模型的解决方案突围。
相比之下,大厂自研的大模型则姗姗来迟。直到8月初,腾讯自研的混元大模型和字节打造的AI对话类产品Grace才先后传出内测消息,具体面世时间仍未可知。
同样停留在测试阶段的,还有李开复创立的AI 2.0企业“零一万物”。在7月3日举办的对外交流会上,李开复透露,该公司在三个月内已实现百亿参数规模的模型内测,目前正向300亿—700亿参数规模扩大。不过,该产品至今仍未向市场开放。
这些仍未发布的大模型产品将为科技行业带来什么样的改变,值得市场期待。从这个角度来看,这场混战或许还要持续很久。
01
进击的王小川
由王小川创立的百川智能,正以其惊人的产品发布速度吸引市场的关注。
在其4月宣布下场做大模型后,仅用了两个月零五天的时间,就在6月15日发布70亿参数开源大模型Baichuan-7B。不到一个月时间,又发布了130亿参数开源大模型Baichuan-13B。
8月8日发布的Baichuan-53B,已经是这家大模型创业公司半年内发布的第三款产品,百川智能进展神速。
百川智能相关负责人回复时代财经表示,公司在创立之前就已经花了很多时间做前期准备,开始就把路线和方法想得比较清楚。
其指出,做大模型都会考虑三个层面:数据、算法和算力。抛开算力不说,做搜索的公司天然有优秀的数据能力,百川智能的核心团队此前已经做了20年的数据抓取、抽取、清洗、去重、反垃圾等操作,可以更快拿到高质量数据集。
而算法是以自然语言处理为中心,将算法工程进行迭代,不是单一的工程问题,而是在文本数据驱动下,算法和工程共同运行。此前在搜索领域积累的经验在这里也能很好地发挥作用,利用数据评价推动模型进步。
“有了之前多年的技术和经验积累,百川智能做大模型产品的速度才会又快又好。”
不过,在发布会上,王小川亦指出,当下国产通用大模型仍处在一个分型复刻的阶段。各家厂商基本都在对标OpenAI,不可避免地会出现同质化的问题。
正因如此,在他看来,与美国闭源大模型的头部格局已定的情况不同,“中国谁的大模型最好”现在并没有结论。在这场混战之中,钱是重要的,但最终决定的力量还是人和团队、组织能力。大厂钱多、人多、算力多,但组织效率通常不一定够好,创业公司的组织效率可能好,也可能不好。
“大家都在争取机会,而且不一定落在大厂里。”
王小川还在采访中谈及退场的王慧文。其指出,王慧文是国内几个主流做大模型里唯一一个没有强势技术背景的,对他的挑战比其他家要大。工作中要做大量的技术决策,招什么人、走什么技术路线图、需要多少计算资源,一定会面临非常多的决策压力。
“不是做大模型压力大,是没有技术背景做决策压力会大很多。但是技术足够的话,其实挺愉悦的。”
02
腾讯、字节姗姗来迟
大模型混战开启之初,互联网大厂因为坐拥更多算力、人才、资金和数据,被认为是强大的竞争对手。
百度自研的文心一言早在今年3月底就已率先落地;阿里打造通义千问紧随其后,在4月11日举办的阿里云峰会上揭晓。就在阿里发布通义千问的前一天,王小川才刚刚宣布下场,成立百川智能。
相比之下,同为一线大厂的腾讯跟字节,推出通用大模型的步调要慢许多。
8月3日,据36kr报道,腾讯自研的 “腾讯混元大模型”已经进入应用内测阶段。三天后,8月6日,字节旗下的AI对话类产品Grace也被爆出历经两个月的研发后,终于进入测试阶段。
此时距离百度发布文心一言已经过去4个月。对于腾讯通用大模型产品步调稍慢的原因,马化腾曾公开表示,“腾讯也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”
不过,“并不着急”的腾讯,还是在今年6月中旬率先公布了“行业大模型”的路线,一口气抛出10大行业超过50个解决方案。无独有偶,字节跳动也同样在6月发布大模型服务平台“火山方舟”,通过集成多家AI科技公司及科研院所的大模型,向企业提供全方位的平台服务。
市场曾一度认为,行业大模型将成为这两家大厂突围的方法。
但事实或许并非如此。当下被鼓吹的行业大模型始终存在着被替代的风险。科大讯飞总裁吴晓如曾向时代财经指出,10年前,在语音识别技术上,也曾诞生过诸多聚焦在通话、行车、办公等不同场景的专用模型,但随着通用模型技术的成熟,专用模型也随之退场。
“我认为大模型也会经历一样的阶段。”
相比之下,从更长远角度看,通用大模型才真正代表着一个平台级或颠覆性的大机会。正是因此,腾讯和字节都不可能放任自己错过,哪怕进度缓慢,但它们必定要坚持在场。
有腾讯内部人士向时代财经指出,腾讯的计划一直是两条腿走路,通用和行业齐头并进。只是与一些激进的厂商相比,旗下产品涵盖社交、游戏、广告、内容创作等多个领域的腾讯,要更为谨慎一些。
03
学院派创业者另辟蹊径
在大模型战场上,来自高校、研究机构的学院派创业公司组成了竞争的第三极。
它们既不是王小川、王慧文这样的种子选手,在创业之初就能凭借人脉吸引到数亿美元的投资,并以此迅速起步。也不像腾讯、阿里、百度这样的大厂,在算力、人才、资金等各个方面都占据难以逾越的优势。
但凭借着他们对于人工智能技术的深度理解,这些创业者仍然能在夹击之下,另辟蹊径找到新的发展方向。
比如由原微软亚洲研究院副院长周明创立的澜舟科技,不同于市面上一众追逐千亿乃至万亿参数的大模型产品,这位从1980年就开始研究NLP(自然语言处理)的华人AI大牛希望以更轻量级模型解决B端场景的问题。
其推出的孟子大模型曾以十亿参数,刷新此前被百亿、千亿级别参数模型轮番霸榜的中文语言理解权威评测基准 CLUE 榜单。
这是一项务实的决策。出于数据安全考虑,绝大部分企业都不会将数据上传,而是会要求本地化部署,成本因此被显著拉高。在接受媒体采访时,周明指出,哪怕只是本地部署推理,拿训练好的大模型来用,千亿参数大模型也需要8到16块 A100,换算下来至少是一两百万元的投入,“对很多场景来说,客户需要便宜和够用”。
由新加坡国立大学校长青年教授尤洋创立的潞晨科技,则希望利用算法技术降低大模型的调用成本。
现如今,无论是大厂,还是创业公司,都必须面对国产大模型同质化趋势愈发明显的问题。如果这一问题不被解决,未来大模型极有可能陷入当下云服务厂商面临的低毛利困境。
尤洋对时代财经表示,这是因为底层技术基座迭代成本过于高昂。他以GPT举例,OpenAI每一次的训练成本高达6000万美元,每隔三四个月就需要训练一次,迭代一次则需要四五次训练。以此计算,每迭代一次技术基座可能需要2亿到3亿美元。
过于高昂的成本导致市场上的技术基座极其稀缺。基本上只有GPT、LLAMA,还有国内的GLM。各家厂商基本都是在模仿这几家大模型做产品,才导致了同质化的问题愈发凸显。
长期研究高性能计算的尤洋因此成立了潞晨科技。该公司目前推出的开源系统Colossal-AI 可通过高效多维并行、异构内存等技术,显著降低AI大模型训练、微调和推理的开发与应用成本。
尤洋认为,只有伴随大模型训练成本快速下降,或者采取更好的优化技术,使得参数控制在200亿左右,还依然能够达到和千亿参数一样的效果时,才会真正迎来大模型百花齐放的那一天。
文章评价匿名用户发布发布标签:
- 大模型激战半年,腾讯字节姗姗来迟
- 龙江风采福彩3d开奖结果 龙江风采
- 建设银行投资金条价格今天多少一克(2023年08月18日)
- 别跑空!长春这里临时关闭
- 葡萄高效栽培技术与病虫害防治图谱(关于葡萄高效栽培技术与病虫害防治图谱简述)
- 渔获回港
- 一夜大涨超25%!法拉第未来官宣:反向股权分割提案获批!这位世界冠军赛车手成为车主及开发者共创官
- 上海小南国(03666.HK)拟8月31日举行董事会会议批准中期业绩
- 华为辟谣“车BU独立”,但王军重磅回归,释放什么信号?
- 蓝途旅行网(关于蓝途旅行网简述)
- 首个数字普惠领域金融行业标准出台
- 济南市顺利完成2023年上半年育儿补贴发放工作
- 常州一工厂生产的预制桩涉嫌偷工减料?记者实地探访发现确实存在猫腻
- 中荣股份:接受信达证券调研
- 老年读者想看上海书展怎么障碍重重?
- 回购潮起!市场见底大信号?
- 实操:抖音直播带货详细讲解
- 稳楼市,又有多地出手!
- 八旬老妪要打车去1000公里之外走亲戚?南京特警一查她是找不到家了
- 央行:推动系统重要性银行按时满足附加监管要求 研究起草系统重要性保险公司附加监管要求
- 迪马股份被重庆宇邦线缆申请破产清算 法院以证据不足不予受理
- 并非每位缺牙者都具备立刻种牙的条件!哪些患者种牙需要辅助治疗?
- 央行:结构性货币政策工具“聚焦重点、合理适度、有进有退”
- 科创板资金动向:3股主力资金净流入超5000万元
- 细扒《封神2》8大看点:三头殷郊成叛徒,邓婵玉姬发有感情戏?
- 此项市级复赛评选,松江国动系统“榜上有名”!
- 老电脑怎么处置
- 中荣股份:公司不存在纸价下行方面的红利
- OPPO Watch4 Pro 旗舰智能手表配置曝光,搭载骁龙 W5+BES2700 双芯平台
- 十里尹村改造项目拟于九月底交付 全市城中村改造已有279栋回迁楼主体封顶
- 宋之丁氏家无井而出溉汲常一人居外断句(宋之丁氏家无井而出溉汲常一人居外)
- 斗罗大陆:五位女神登场争艳,小舞活泼可爱,善良温柔,勇敢坚韧
- 暴雪CEO称《暗黑4》下一部新作不会再让玩家等待太久
- 央行下调SLF利率10个基点
- 壮士一去兮不复还的意思(壮士一去)
- 海南加快制度创新优化营商环境
- 李嘉诚新盘一天就被抢光!600万港元买两居,香港打工人抢疯了!
- 消息称英特尔放弃54亿美元收购以色列高塔半导体
- 郑钦文:过山车逆转大威,晋级WTA1000辛辛那提16强+pk世界第1斯娃
- 哪款汽车的灯最好用 最为经典的4款跳灯车型
- 中国铁建08月16日被沪股通减持30.78万股
- 如何查找车辆多久报废(如何查找车辆是否报废)
- 因涉赌再被推上风口浪尖,Soul难掩安全漏洞
- 8月16日ChatGPT概念板块跌幅达2%
- 百姓亟需物资即时送达
- 中国驻塔吉克斯坦使馆提醒中国公民注意赴塔旅行安全
- 成功了!石景山支援门头沟雁翅镇自备井出水啦
- 奥泰生物:实控人提议以4200万元-6000万元回购股份
- 重型燃气轮机板块概念股有哪些(2023/8/15)
- 越剧西厢记琴心曲谱(越剧西厢记琴心)
- 合富新材(831614):2023年上半年净利润81.3万元,同比减少81.9%
- 车评头条:大众汽车正在停止生产美国规格的高尔夫
- 和田玉不含油脂成分,为什么会有油脂感呢?【古玉辨伪必看】
- 台风“兰恩”登陆日本 鸟取县暴雨成灾
- 浦东新区:街镇可成生态环境损害赔偿权利人代表
- 美国6岁男孩开枪射杀老师 母亲承认忽视儿童重罪
- 8月16日基金净值:景顺长城国证新能源车电池ETF最新净值0.6292,跌0.33%
- 忘记历史就是背叛!记者探访日军“毒气岛”
- 云南保山22岁女大学生疑被骗至境外,反诈中心:按程序启动调查
- 白菩提和白玉菩提
- 以岭药业:化药创新药XY0206片药物临床试验申请获受理
- 河北廊坊:全民健身动起来 幸福生活更精彩
- 特变电工:净利润增速大幅下降系原材料价格所致
- 润丰股份:8月15日融资买入192.23万元,融资融券余额1.84亿元
- 养老院发生护工猥亵事件后获“年度优秀集体”?院方:人去年被带走,不知道判决结果,郑州民政:注意到舆情,有专人调查
- 巴西队队长是谁2022(巴西队队长)
- 《黑帮之城》一款“沉浸感”爆棚的PC模拟类游戏
- 【东海期货8月15日研究所晨会观点精萃】:美债收益率持续上升,美元继续反弹
- 海易通拟将持有的乌海海易通客运有限公司51%的股权以34.68万转让给内蒙古航远科技有限公司
- 阿里云上市前夕,钉钉“单飞”了
- 全国首家中学生地球科学科普教育基地落户青岛
- 福建医科大学附属泉州第一医院整形外科好不好?价格表和医院信息速来了解!
- 八卦媒体曝陈坤有两个孩子 一家同逛商场亲密拍合照
- 银杏教育(01851.HK)拟8月25日举行董事会会议 审批中期业绩
- 原神初始号选什么角色好 前期必练的四个角色
- 侯马农商银行张婷婷:让奉献在平凡岗位上发光
- 天津:护堤人在行动
- 信任他人的成语
- 国家统计局:1-7月份商品房销售额70450亿元,下降1.5%
- 塞维利亚主席:拉莫斯想来?我还想要一架飞机呢,你现在给我
- 葫芦牌(关于葫芦牌简述)
- 迅雷:2023 年 Q2 总营收 1.04 亿美元,同比增长 33.3%
- 平安夜送什么礼物给女朋友(平安夜送什么礼物)
- 联合国官员:苏丹武装冲突已导致超过4000人死亡
- 坚持生态优先绿色发展 湖北恩施建设“两山”实践创新示范区
- 东阳光药丙肝1类新药英强布韦上市申请获受理
- 北京在8个国际人才社区新布局24所国际学校
- 8月15日基金净值:嘉实中证央企创新驱动ETF最新净值1.4151,跌0.25%
- 灵活就业人员社保按照什么档次缴纳最划算?
- hytera对讲机充电器(hytera)
- 中银证券:给予常熟银行增持评级
- 四川富顺警方破获多起非法狩猎案 放生4700余只保护动物
- 杭州亚运筹办践行绿色低碳理念
- 日系轿车不香了:中国7月销量暴跌34.6%
- 国台办:赖清德鼓噪“台独”只会给台湾带来兵凶战危
- “双碳”目标的“基础设施” 正提速建设
- 2023香港小姐候选佳丽泳装亮相
- 美股三大指数开盘下跌,SEA跌超20%
- 《前任4:英年早婚》定档9月28日
- 科大讯飞:明年上半年讯飞星火大模型代码能力将对标GPT-4
广告
广告
- 如何服务企业?两江新区这样做!
- 杭州动物园大熊猫馆“新馆主”今日亮相 预约攻略请收好
- 优信发布2023财年业绩 全年营收达20.59亿元同比增长25.9%
- 湖北发布工程款支付担保管理办法
- 断供留学生,送外卖到深夜,我靠自救撑到毕业
- 上海市检三分院以跨行政区划检察合力守护长三角绿色生态
- 中国石化夯实资源基础 加快构建能源保障体系
- 上海杨浦:以“校区+园区+社区”模式激发城市创新活力
- 汉商集团:筹划重大资产重组 8月18日开市停牌
- “县”在出发——行走百县话振兴 | 黄皮熟了!岭南佳果造就富民兴村产业梦
- 2023国际自主智能机器人大赛圆满闭幕
- 规制互联网诊疗的法律位阶该升一升了
- 重疾险为啥都选20年交?
- TEAMWAY INTL GP(01239.HK)委任曾文佑为执行董事
- 「视频」「央视快评」做绿水青山就是金山银山理念的积极传播者和模范践行者
- 电影大空头原型买入美股看跌期权
- 史密斯夫妇的电影(史密斯行动)
- 上海共青团推进“万场宣讲进青年”活动
- 剥花生壳小妙招 剥花生壳小妙招图片
- 苏州调整耗材支付政策,心脏瓣膜自付从17万降至4万出头