9月24日,字节越过旗下火山引擎发布了豆包视频生成 - PixelDance、豆包视频生成 - Seaweed 两款大模子,以及豆包音乐大模子、同声传译模子等产物,为大模子规模注入了新的活力。
大模子行业历经2022年年底的颠簸、2023年的追逐以及2024年的逐步松弛,厂商们开动革新业务标的,从通用型转向左右端,从检修侧转向推理侧。火山引擎总裁谭待指出,中国大模子左右未能作念大,老本是一个蹙迫原因。如今,行业将老本价钱 “打” 了下来,转向左右成为势必趋势。
豆包大模子并不参与价钱战,而是接力于于让价钱总结合理。现时,豆包大模子日均 tokens 使用量卓著 1.3 万亿,较 5 月数据增长了 10 倍;日均生成图片 5000 万张,日均处理语音 85 万小时。谭待合计,当大模子价钱不再成为进犯立异的门槛时,跟着企业的大限制左右,大模子救济更大的并发流量将成为行业发展的要道身分。对于降价带来的营收压力,谭待示意,对 To B 厂商而言,技巧与产物的可握续性最为蹙迫。降价后的火山引擎并未出现负毛利情况,但具体毛利数据暂未深切。
对于推出视频大模子的时刻,谭待解释谈,往时豆包视频大模子主要用于字节越过集团里面,里面技巧对外怒放成为商用业务需要一定时刻。同期,企业客户无数存在对安全性与清爽性的担忧。此前,豆包视频大模子在字节越过里面已配合即梦 AI 与剪映进行产物试用。本年 7 月,世界首部 AIGC 生成式流通性叙事科幻短剧集《三星堆:畴昔启示录》在抖音上线,由博纳影业出品制作,抖音旗下即梦 AI 提供首席技巧救济。这次公开,技巧层面惩处了视频生成模子大多只可完成浅显教导的问题,可完了当然连贯的多拍动作与多主体复杂交互。
豆包视频生成模子基于 DiT 架构,通过 DiT 交融推测单位让视频在大动态与运镜中开脱切换,还通过扩散模子检修步伐攻克了多镜头切换的一致性辛苦,在镜头切换时可同期保握主体、立场、氛围的一致性。现时,豆包视频大模子已落地于电商营销、动画讲明注解、城市文旅、微脚本等企业场景,为专科创作家和艺术家们提供了创作赞成。
这次豆包大模子发布的产物隐蔽言语、语音、图像、视频等全模态。对于畴昔多模态 AGI 的发展,谭待示意,现时行业技巧还需愈加竭力智商拼集摸到 AGI 的门槛。
当作字节越过集团内的产物,这次由火山引擎面向 B 端客户推出豆包视频大模子,充分体现了集团对 AI2.0 时间下云推测业务的怜爱。跟着东谈主工智能技巧的不息进步,大模子在各个规模的左右将越来越平方。火山引擎的豆包大模子以其合理的价钱、弘大的功能和平方的左右场景,有望在大模子阛阓中占据一隅之地。
在畴昔,大模子的发展将赓续朝着左右端深入拓展。企业需要不息立异,擢升峻模子的性能和清爽性,猖獗不同客户的需求。同期,行业也需要加强息争,共同激动大模子技巧的进步,为社会经济的发展作念出更大的孝顺。
总之,火山引擎推出的豆包视频大模子为大模子行业带来了新的机遇和挑战。折服在畴昔的发展中,大模子将在更多规模发达蹙迫作用,为东谈主们的糊口和使命带来更多的便利和立异。
声明:新浪网独家稿件,未经授权谢却转载。 -->