2025年,视频生成技术正从“功能可用”逐渐走向“场景精专” ,企业既需要媲美影视级的画面质感 ,又要满足极速生成需求; 既要精准控制细节,又要避免高昂成本。效果、速度、性价比的三角平衡成为行业新命题。基于此,2025年5月13日,在 FORCE LINK AI 创新巡展·上海站的现场,火山引擎发布豆包·视频生成模型 Seedance 1.0 lite和豆包1.5·视觉深度思考模型,并带来了升级版的豆包·音乐模型,旨在以更全面的模型矩阵、更丰富的智能体工具,帮助企业打通从业务到智能体的应用链路。

豆包·视频生成模型Seedance 1.0 lite:兼具效果、速度和性价比

豆包视频生成模型Seedance 1.0 lite,是豆包视频生成模型系列的小参数量版本,支持文生视频、图生视频,视频生成时长支持5s、10s,并能提供480P和720P两种分辨率。该模型既能实现影视级的视频生成质量,也让视频生成速度得到大幅提升,是一款兼顾效果、速度、性价比的模型。

具体来说:

首先,该模型拥有更精准的指令遵循。通过强大的语义理解,可以精细控制人物的外貌气质、衣着风格、表情动作等,并在多主体动作解析、嵌入式文本响应、程度副词和镜头切换响应方面具有优势。比如,以一名女生使用吹风机的生成视频为例,视频中的女生表情变化自然,头发被吹起的方向、速度和幅度,均符合动作生成的物理规律。

其次,该模型拥有更丰富的影视级运镜。支持360度环绕、航拍、变焦、平移、跟随、手持等多种镜头语言,拥有细腻高清的基础画质,能够带来影视级的美感画面。比如,在180度的运镜下,粉底液展示流畅稳定、光线变化自然,美观体现了产品质感。

再次,该模型拥有更合理的运动交互。通过分析动作时序与空间关系,它能带来人物之间和物体之间自然流畅的交互动作,运动轨迹和受力反馈更加契合现实规律。比如,以果汁饮料广告的生产视频为例,细腻的果汁喷溅效果加上镜头推移,能让用户更有购买欲望。

在应用场景上,Seedance 1.0 lite模型可被广泛用于电商广告、娱乐特效、影视创作、动态壁纸等场景。例如,在电商领域它可以帮助商家快速生成高质量的营销视频素材,进而精准地匹配产品展示和活动推广等场景,降低该类素材的制作成本与制作周期。

目前,企业用户可在一站式大模型服务平台火山方舟使用该模型API,个人用户可在豆包APP和即梦APP中体验。

豆包1.5·视觉深度思考模型,在60项公开评测中取得38项第一

此次发布的豆包1.5·视觉深度思考模型,尽管激活参数仅有20B,但却具备强大的多模态理解和推理能力。在累计60个公开评测基准中,该模型在38个公开评测基准中取得 SOTA 表现,在视频理解、视觉推理、GUI Agent能力等方面均处于第一梯队。



在视频理解上,该模型支持动态帧率采样,视频时序定位能力得到显著增强,结合向量搜索它能精准地定位视频中与文本描述相对应的片段。

在视觉推理上,该模型新增了视频深度思考能力。通过学习数万亿多模态标记数据,它掌握了较为广泛的视觉知识,结合强化学习让其视觉推理能力得到大幅提升。例如,在复杂的图形推理题中,模型先是提出假设,然后进行推理检验,当发现和假设不一样时,模型还能通过不断反思提出新的猜测,直到得出正确答案为止。

在GUI Agent能力上,基于GUI定位性能该模型能在PC端、手机端等不同环境中完成复杂交互任务。例如,它能针对新开发APP的功能进行自动化检测,目前该功能已被用于字节跳动多款APP产品的开发测试中。另据悉,豆包1.5·视觉深度思考模型已经在火山方舟上线。

2024年,火山引擎推出了豆包·音乐模型,用户仅通过一张图、一句话就可以创作10多种不同风格的高品质音乐。此次升级之后的豆包·音乐模型,不仅支持英文歌曲创作,还可以在理解视频之后自动地适配纯音乐BGM。火山引擎大模型解决方案总监冯书云

表示:“以后背英语单词不再只是枯燥地记忆 ,而是可以用音乐创作来记单词 ,用旋律来强化记忆。此外,豆包音乐模型还能帮普通人写歌、做广告配乐,甚至把你的朋友圈文案自动转成小调,真正实现‘人人都是作曲家’,希望借此能够不断降低音乐创作的门槛,让每个灵感和需求都能用音乐表达。”目前,豆包·音乐模型已经全量上线,个人用户和企业用户均可在海绵音乐和火山引擎官网体验。

Data Agent和新版Trae:用AI重塑数据关系和代码开发

谈及当下大火的智能体,火山引擎副总裁张鑫表示:“智能体的效果不是一次性搭建的静态结果,而是数据、模型、工程、业务动态耦合的持续迭代的过程。所以,智能体不光需要一次性的搭建,还需要持续的全生命周期的管理。”人们常说数据是模型的“第二脑”,火山引擎所打造的企业数据全场景智能体DataAgent,让开发者可以基于动态的多模态数据湖,用AI重塑数据的关系。Data Agent具备主动思考、洞察、分析和行动等能力,故能用于数据分析和智能营销等场景,从而帮助企业用户挖掘数据资产价值。火山引擎数据产品解决方案负责人萧然表示:“Data Agent能像人一样思考,会像一个企业级数字专家一样把结构化数据和非结构化数据加以结合吸收,同时可以调度化的实现业务流程。它既能学习行业Know-how,也能把学会构思新经验,能像一名会思考的数据专家一样陪伴着人们。”

具体来说:

在数据分析上,Data Agent能够融合企业内结构化与非结构化数据,结合联网知识可以精准理解业务需求,从而快速生成专业、深度的研究报告。通过以自动化方式制定分析方案、追溯指标波动、运用自助分析工具以及搭建预警系统,它能实现数据处理的全流程智能化,将复杂报表的生成时间从 2 天缩短至 30 分钟,显著提升数据获取与决策效率。“之前需要几天才能分析出来一个结果,现在打开电脑之后,只需冲一杯咖啡的时间,再坐到电脑面前可以Data Agent就会通过充分思考把结果呈现在电脑前。”萧然表示。

在智能营销上,Data Agent能够实现从策略制定到执行优化的全链路闭环管理,高效地完成人群圈选与策略拆解,从而基于个性化引擎实现精准营销。此外,它的智能会话辅助功能与自动复盘优化功能,可以不断提升转化率与客户满意度,实现营销策略的动态迭代。“很多营销活动都要抢时间,而Data Agent通过几分钟就能实现效果,当同业伙伴还在做活动的同时,我们就能提前两天把热点活动上线。”萧然指出。

同时,为了帮助开发者更便捷地利用AI提升开发效率,国内首款 AI 原生 IDE 产品Trae也实现多个重点功能升级。具体来说:新增了统一型AI对话面板,让所有交互仅需一个对话框;新增了支持自定义 @Agent,可以构建个人的专属 AI 团队;新增了联网搜索 #Web 和文档 #Doc 的上下文理解类型,能让AI 更准确、更高效地执行需求;新增了通过MCP让AI主动调用外部工具的功能。眼下,Trae已配置豆包1.5·深度思考模型,基于模型的主动深度思考能力和20毫秒极低延迟能力,能够更快、更好地生成代码。

豆包大模型已覆盖4亿终端设备,能实现良好落地的AI才是真AI

张鑫表示:“在AI热浪中似乎有两条平行线:第一条是在媒体报道和企业宣传里,每天打开手机映入眼帘的都是大家非常熟悉的关键词,比如‘刚刚!’‘突发!’‘重磅!’‘登顶!’等。另外一条平行线存在于企业真正落地的时候,我经常听到一线人员反馈称AI应用的效果仅为一般水平,推广起来动力不足。我也听到企业管理人员反馈这个AI太烧钱或者带来的业务价值不明显。”他表示,要想让“技术进步”和“企业有获得感”获得交集,要在AI落地中走好三段旅程:第一段旅程是基于业务视角的投资回报旅程,第二段旅程是基于技术视角的模型基建旅程,第三段旅程是面向最后一公里实现用户和场景的智能体落地全生命周期的旅程。

由此可见,能实现良好落地的AI才是真AI。同时,也正如冯书云在本次活动中所言:“不同的业务场景对模型的能力要求千差万别,让专业的模型应对专业的需求,才能真正释放AI的价值。”目前,豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业落地,覆盖4亿终端设备、八成主流车企、70%系统重要性银行和数十家证券基金公司、近七成的 C9顶级高校和100多家科研院所。

在游戏行业,巨人网络正在借助大模型能力重塑游戏体验和玩法创新。通过火山方舟接入豆包大模型及 DeepSeek,巨人网络已在旗下《太空杀》中推出Al原生游戏玩法“内鬼挑战”,基于大模型深度思考等能力打造Al玩家,与真实玩家进行实时策略对抗,重新定义了社交推理游戏的智能边界。同时,巨人网络旗下MMO国战手游《原始征途》也已通过接入大模型打造了AI 智能NPC“小师妹”,从而能在游戏策略指导、情感陪伴等方面提供更智能、更人性化的交互体验。此外,借助火山引擎机器学习平台所提供的大模型训练和资源保障,巨人网络亦推进了自研大模型的迭代优化。巨人网络AI 事业部负责人丁超凡表示: “我认为在多模态大模型的驱动下,游戏与影视的边界正被重新定义,未来游戏创作的唯一限制将只会是创作者们的想象力。我们或许正迈向一个全新的内容时代:在这里‘所见即所得’,每一帧画面都源于实时生成;‘所玩即所创’,玩家的每一次行动都在塑造个性化的故事。内容创作将不再专属于专业团队,普通用户也能借助AI的能力即时地生成场景、推动剧情和演绎角色,从而实现从‘参与者’到‘参与即创作’的身份跃迁。后续,我们也会与豆包和即梦继续共同探索下一代游戏内容与交互的新范式,实现游戏创作平权与民主化。”

在医疗行业,礼来制药搭建了专属 AI 应用开发平台,支撑从药物研发到疾病诊疗的全场景创新。通过可视化的工作流编排,礼来制药搭建了HCP Chatbot、地区经理辅导报告等智能体,在学术沟通、销售培训、疾病教育等多个场景中形成应用,实现了企业 AI 资产的沉淀与持续化运营。礼来制药IT业务伙伴AI负责人Ellen Xu表示:“我们尝试过不同的大模型,我们认为豆包是比较合适的一款模型,我们在医疗领域做了一些模型优化,通过一些公开和非公开的语料进行模型训练,支撑了医药行业的创新。”

张鑫表示,模型、算力、数据、安全构成了AI时代的新基建。火山引擎也提供了这样的四件套,比如豆包大模型已经支撑了内部50多个业务和外部30多个行业的深度共创。截至2025年4月份,豆包大模型日均Tokens调用量超过12.7万亿,在这背后火山引擎AI云原生提供了强有力的系统承载力,包括极致且充沛的算力资源、推理层极致的性能优化以及弹性大规模系统调度能力。与此同时,安全、合规是企业的底线,为此火山引擎在国内首发的PCC私密云计算平台,可以解决端和云协同计算过程中数据泄露的问题,并能通过大模型的防火墙消除一系列大模型攻击的隐患。

而对于此次巡展的举办地——上海,张鑫称这里是中国AI生态的“雨林”。他指出,上海正以强劲的加速度,踏上了从“魔法之都”到“模型之都”的旅程。火山引擎希望继续推动AI的普及,让大模型像“小笼包”一样走进千家万户和千行百业。“同时,也希望携手更多企业,让AI落地方式从以前的手写‘Hello World’编写代码变成更加轻松的对Agent Say ‘Hi’的方式!”张鑫最后表示。

ad1 webp
ad2 webp
ad1 webp
ad2 webp