告别文本和通用! 大模型奔向2.0时代

2024刚开年,大模型这把火又“烧”了起来。

1月5日,OpenAI就宣布将上线自定义的“GPT Store”商店,有行业人士人分析称,大模型已经从纯技术突破层面的“iPhone时刻”,进化到聚焦于AI应用的“App Store时刻”。

之后不久,马斯克在社交平台透露,他投资组建的xAI团队研发的首个AI大模型产品Grok 1.5或将在2月份发布,可以预见,经常会有惊人之举的马斯克又将给大模型行业增加新的创新因素。

加之华为、小米、阿里、vivo、OPPO等厂商的助推,大模型进手机、大模型进汽车的势头越演越烈,开始成为各自行业的发展趋势。

不难看出,从最开始关注大模型本身,到如今一批探索大模型应用的开拓者们陆续取得进展,大模型落地应用的竞争成为新的焦点。

1月30日在中国V谷马栏山举办的多媒体大模型创新应用高峰论坛引发行业新一波关注。中国科学院院士王怀明、加拿大皇家科学院院士李明齐聚,对大模型的发展进行了各维度的洞察。现场圆桌环节,众多行业大咖还对“大模型+”“+大模型”进行激烈讨论,各方观点对大模型发展的现在、未来作了深入的分析、解读。一个行业共识是,大模型正迈入2.0时代!

万兴科技董事长吴太兵在会上表示,大模型已进入“多媒体+垂直解决方案+算力数据及应用本土化”的2.0时代。1.0时代,通用大模型占主流,好比“科学家”,解决“原材料”和“零配件”生产;2.0时代,垂直大模型增长趋势明显,好比“工匠”,可对“原材料快速、灵活组装加工等,对用户从模型到应用场景一条龙赋能。

会上,2.0时代的国内首个音视频多媒体大模型——万兴“天幕”也正式发布,并宣布其大模型研发中心落户马栏山视频文创产业园,将行业的视线再度向垂类大模型、向大模型赋能应用聚焦。

 告别文本和通用! 大模型奔向2.0时代 -图1

国内首个音视频多媒体大模型万兴“天幕”发布

4个月时间的再进化

早在去年9月的世界计算大会上,万兴科技就曾透露即将发布“天幕”大模型,并表示当时亮相的10多款AI应用中已经植入了“天幕”的能力。之后,万兴“天幕”十分活跃,几乎每隔一段时间,就会有新的能力升级亮相。

有博主用AI创作《男孩的一生》引发全网共鸣,“不求大富大贵,但求一生平安健康。”

万兴“天幕”旋即通过文生视频的能力,用《女孩的一生》响应,同样张力十足,网友祈愿“每个女孩都能被生活温柔以待”。

最近,电视剧《繁花》热映,时代的变迁、城市的进化与普通人的生活,都在《繁花》中得到了淋漓尽致的展现,“天幕”则以AIGC的视角,以《迷失上海》重回90年代的繁花上海都会生活。

 告别文本和通用! 大模型奔向2.0时代 -图2

AI短片《迷失上海》相关素材由万兴“天幕”生成

在文本生成视频之外,万兴“天幕”还拓展了视频生成视频能力,创作出《百变girl》;AI扩图能力升级,创作出《名画秘境》;AI歌手翻唱,15秒即能生成一个可以超逼真自然的定制AI歌手……

万兴“天幕”的全面赋能之下,每个人都能成为自己的“导演”。

万兴“天幕”一定程度降低了多媒体创意内容生产的门槛,提高了效率,还通过在跨境电商、办公、教育等场景的应用,探索着传统多媒体创意内容生产模式的路径

比如,视频剪辑软件Wondershare Filmora 13全新版本利用天幕大模型能力落地了AI Copilot智能剪辑助手、AI文字快剪、AIGC音乐生成等备受海外用户好评的功能,从去年8月份至12月底,使用AI功能的用户数增加了243%。

再比如,为解决出海企业营销痛点,万兴播爆通过万兴“天幕”大模型数字人能力的应用,使AIGC更好地服务于出海视频创作者,去年1月至今年1月,该应用月活数实现了超700%的增长。

本次万兴“天幕”的发布,除了应用的能力有了升级之外,还有合作方面的升级。在会上,万兴科技与马投算力、华为云达成三方算力合作,并与中广天择达成大模型算料合作,在底层的算力、算据等方面都做了夯实加码。

再往前,万兴科技还与燧原科技等算力行业领先者、湘江实验室等科研机构达成合作。

很显然,万兴科技正在搭建起了一个以“天幕”为中心的多媒体大模型应用生态架构,包含底层的算据算力支撑,应用场景的落地,及更针对领域的影响辐射。比如其研发中心所落地的马栏山视频文创产业园即是中国音视频领域的桥头堡,湖南卫视、芒果TV等等都在园区内,被称之为“中国v谷”,势必可衍生出系列的合作机会。

鸣响首枪为什么是天幕?

4个多月时间的进化,进化的是能力、是生态搭建,更是定位和价值。“天幕”用“音视频多媒体创作垂类大模型”,回答了“百模大战”下,究竟会打造成一个怎样的大模型。

李彦宏在去年年末举行的“WAVE SUMMIT+深度学习开发者大会2023”上提到,一定要去卷AI原生应用,只有依附于应用的模型才有价值,“在AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”

周鸿祎、王小川等大佬也持同样的观点,在不同场合不约而同地强调,应用才是AI的沃土。

于是,我们可以看到,字节跳动推出“豆包”“小悟空”等,侧重搜索与视频编辑;腾讯推出“小琴”“未伴”“AI一起听”等,侧重社交与音乐;京东推出“京言”等、阿里巴巴推出“淘宝问问”等,双双侧重电商购物;百度更为彻底,旗下产品全部重塑,此外还推出了“百度GBI”“云一朵”等AI原生应用……

上述案例多为以文本、语义理解以及图绘为主的通用大模型在具体场景的落地,我们可以将其视为大模型落地的1.0阶段。

而现在,伴随大模型向垂类场景发展,大模型落地进入到2.0阶段,生成内容也从文本进化到音视频多媒体。与文本生成为主的大模型相比,多媒体大模型的主要难度在于,音视频内容的组成元素更多,内容结构和层级也更加复杂。

即便只是一段几十秒,甚至只有几秒的视频,也要包括动画、字幕、音乐、特效、转场、封面、画中画等几十种元素。

 告别文本和通用! 大模型奔向2.0时代 -图3

视频制作内容构思、资源获取、生成、编解码,链路与技术门槛高

虽然不少厂商在多媒体赛道也有发力与探索,部分多媒体大模型也具备了一定的优质音视频生产能力,但在生成内容的长度、一致性,画面内容的质量与算力成本的平衡,生成式可控性等方面还是存在尚未解决的挑战,因而一直未能迈出商业落地的关键一步。

“天幕”能够在大模型2.0阶段率先落地,其中的关键主要有两点,一是有强大的研发能力作为支撑,产品确实能打;另外一个则是对应用场景的理解。

研发能力是基础,每个跑出的厂商都有自己的独到之处;“天幕”真正的护城河还是在于万兴科技20多年的出海经验、全球超15亿用户行为的洞察。

一面是对行业痛点的洞察,另一面是对用户需求的响应,双向循环下,“天幕”也就越跑越快。

上文提到的月活大幅增长的万兴播爆就是其中典型。

做跨境业务的企业在开展业务时,经常会要拍摄具有当地特色的营销视频,此时就会遇到外籍演员选择有限、国外取景拍摄沟通执行不便等问题,由此产生制作成本高、时效低的痛点。

万兴播爆/Wondershare Virbo在产品中内置了涵盖不同肤色和人种的超逼真数字人,用户只需要几分钟时间就可以快速生成一条营销视频,其中的数字人AI视频翻译等能力就来自“天幕”。

“价值涌现”从做“AI时代的美的”开始

帮助个人和企业降本增效,是大模型的应有之义,已有无数案例对大模型的应用价值进行了印证。

具体到业务层面,万兴科技已经完成了包括万兴喵影、万兴播爆、万兴智演、万兴爱画、亿图、墨刀等数字创意软件应用在内的“天幕”能力应用,部分产品用户规模、用户活跃度大幅提升。

 告别文本和通用! 大模型奔向2.0时代 -图4

万兴“天幕”已在海外规模化商用

应用价值之外,大模型对于开发厂商的商业价值也逐步显现。

万兴科技近日发布的业绩预告显示,预计其2023年归母净利7500万元—1亿元,同比增长81.8%—142.39%。报告期内,公司实现主营业务收入同比快速增长。

万兴科技去年年中总结各项经营数据全面增长的原因时,曾表示全面拥抱AIGC以及订阅转型深化是两大核心要点。

根据Gartner《2021年预测:人工智能对人类和社会的影响》研究,2021年AIGC生成数据占全球数据的比例不足1%,2025年该比例有望增至10%。

Precedence Research则预测到,全球生成式AI市场规模有望在2032年达到1181亿美元,年复合增长率达到27%。

这也意味着,在大模型与AIGC叠加的时代浪潮下,万兴科技还有巨大的发展空间。

需要提醒的是,万兴喵影、万兴播爆等应用并不是和抖音快手一样的短视频软件,而是剪辑+AI视频生成软件。

从视频时代的趋势来看,国内10.44亿网络视频用户中,短视频用户就有10.26亿,占全体网民比例超95%。不谈增量市场可能带来的红利,仅仅为这10多亿用户提供视频创意服务,都有大量文章可做。

过去的20多年,万兴科技的所有业务都围绕着视频创意为核心的数字创意而展开,就连公司口号也是“让世界更有创意”,被外界视为“视频”时代的“卖铲者”。

当时代的进程进入到大模型时代,万兴科技的业务范围显然有所扩展。从创作前的前期准备,到画面编辑、文字编辑、音频编辑,直至发布分享,每一个视听场景用户耗时长的环节,万兴科技都用AI、都用大模型再做一遍

吴太兵曾表达过,要“聚焦应用,做AI时代的‘美的’”的愿景。

“天幕”的落地,是多媒体大模型落地的第一步,也是万兴科技向AI时代“美的”迈进的关键一步,鸣响中国大模型2024开年首枪。

 

转载请说明出处 内容投诉内容投诉
南趣百科 » 告别文本和通用! 大模型奔向2.0时代

南趣百科分享生活经验知识,是您实用的生活科普指南。

查看演示 官网购买