BV百度风投温永腾:多模态技术是下一步AI应用发展的重要驱动因素,未来将催生AI原生应用 | 论坛现场


期,由上海交通大学文创学院、全球高校人工智能学术论坛主办,东西文娱、上海艾萨肯企业管理咨询有限公司、谷元(上海)文化科技有限责任公司、VISCO联合主办的AI+行业变革系列论坛(二)暨VISCO 2023 Al新世代全球峰会-上海站于上海交通大学徐汇校区成功举办。


在“AI+文娱行业变革论坛”部分,BV百度风投副总裁/AI应用赛道负责人温永腾受邀进行了题为《生成式AI的多模态技术领域的进展及其在文娱行业的应用》的主题演讲。


温永腾 BV百度风投副总裁/AI应用赛道负责人温永腾


下为分享实录。


家好,我是温永腾,非常荣幸有这个机会回到校园跟大家分享关于AI的一些认识,因为我自己是做风险投资的,所以我会比较关注技术未来的趋势,以及它可能在商业上的进展。


首先,我先介绍一下我们的基金,BV百度风投是国内最早深入人工智能领域的风险投资机构之一,覆盖人工智能产业链、自动驾驶、医疗、生命科学、机器人、先进计算等细分方向。目前,BV百度风投旗下管理多支基金,总规模超七亿美元,在全球范围内已累计投资200余家企业。我一直在做早期的投资,现在负责我们BV百度风投在AI应用方面的投资。 


我们从2019年就开始关注生成式AI,我们当时叫AIGC,就是AI-Generated Content,当时这还是一个比较小众的行业。这个行业从2019年到现在,发生了很大的变化,在技术上,诞生了包括Stable Diffusion、Transformer等新的生成式技术,在应用上,我们也发现有很多可以创新的场景。我们也投了不少关于生成式AI的项目,包括西湖心辰、生数科技、云舶科技、粒界科技等。


基于投资人的视角,我今天希望分享三个部分,一是我们在业界看到了一些多模态技术的发展,二是和大家分享下我们看到的一些比较好的应用案例,最后我会对应用的发展做一些展望。




生成式AI的
多模态技术发展

我就用ChatGPT来举例子,其实AI的能力边界是在不断拓展的,最早的时候AI会以文本的任务为主 特别是在ChatGPT-4 vision出来之后,图片的理解以及图片的生成,包括语音方面的多模态的能力得到了展现。接下来我们非常关注的就是视频的理解和视频的生成,然后包括有Agent生态,我就不详细展开了。


为什么我们觉得多模态能力很重要,是因为我们觉得如果你要做一个好的应用,从互联网的角度来讲,你不能够给开发者一个单一模态的工具,告诉他你只能用文本的输入和输出,这会给开发者带来很大的局限。因此,我们相信未来的应用一定是多模态的,它包括多模态的理解和生成这些基础的能力。


因此多模态技术的发展是 AI应用发展的一个非常重要的驱动的因素。包括从用户的使用习惯角度出发,整体上现有的互联网的模态已经进入了视频、短视频、VR这样一个丰富模态的阶段,理应给用户更好的模态体验。



生成式AI
将会被应用在各行各业


接下来,我想聊聊我们看到的生成式AI在各行业的应用,我认为这里面有两类公司,一类是以应用为主,另一类是以模型技术为主。

在应用层,生产力工具和内容平台在AI的整体的赋能之下都会发生非常大的变化。特别是内容平台,虽然现在还处于早期,但是我们相信未来不管是在图片还是在视频以及VR的平台上,AI一定会诞生新兴的内容平台,我们觉得这是最大的机会之一。


在模型层,我们认为现在多模态的技术进展刚刚开始,图片和声音模态虽然已经有了一些比较不错的案例,但是视频和3D仍处于早期。


这里举一个例子,我们投资了生数科技,它基于一个Transformer网络架构实现图文模态之间的任意跨模态生成,团队也在自主研发更高参数量的产业级大模型,在文本、图像的基础上融入3D、视频等更多模态数据。


数科技作品


综上,我们对于生成式AI的技术发展充满了信心。



对于未来机会的展望


最后想说一下我的一些展望。


首先AI对于各行业的改造,我们觉得有两个大的方向,一是工具,二是内容平台。在工具这一端,有很多AI是在传统的workflow进行赋能,这个大概率我们认为是传统工具巨头“+AI”的机会,比如Adobe的FireFly。


但是我们也很关注利用AI在新的内容生产场景下构建新工具的机会,比如MidJourney,其客户和使用场景并不是传统的以编辑为核心的需求,所以它在这种新兴需求上是完全可以做出新的内容工具。


然后第二点我们也在展望下一个新的机会是怎么样的。在这里面其实我们从19年开始就一直在讲的一个点,我们认为一个平台的三要素到底是什么?生产,分发和交互,所以我们现在在AI上看到的这三个点都发生了翻天覆地的变化,每一个变革性的机会我们都认为我们从历史上看到都已经产生了1,000亿美金以上的这种机会。


首先我们在内容生产上我们可以看到,不管是从PGC到UGC已经有非常大的变革,我们现在能够去看到的大部分内容平台都是UGC平台,接下来会有AIGC的平台的出现,包括可能需要先通过AIGC+UGC进行过渡。


第二个是在分发上到内容生产的成本无限趋近于0的时候,整个分发系统的逻辑其实也会变化,这也是我们一直在关注的机会。


最后就是交互上不仅有VR,AR这样的新的交互,我们也看到从语言的操作界面,就是说从图形的操作界面到语言的操作界面的一个比较大的变革。


最后,我想跟大家分享一个我们在现在看到一个新的内容平台的机会。Character.ai虽然大家理解它是一个bot平台,但是对我们来说其实这是一个非常好的内容平台。

我就用刚才我的逻辑试着跟大家分析一下,首先它不是一个完全的UGC平台,它是一个AIGC加UGC的平台,只有用AIGC的能力,才能让UGC的用户产生这么好的虚拟角色的内容的效果。


第二个它是一个非常典型的中长尾平台,在现有的内容平台竞争已经非常激烈的情况下,其实AI的新兴娱乐平台只有去在这些中长尾的机会中才能够找到自己生存的土壤,最后它是一个非常好的language UI的交互体验,实际上它是一个文本的内容,现在看起来好像比较单薄,但是它在文本的交互体验上是非常不错的。


我们相信Character.ai只是这个行业早期发展的一个范例,未来会有越来越多这样的AI内容平台出现。


我今天的分享就到这边,感谢大家。


..................

长按识别小程序码,可限时免费阅读

白名单专属内容


Hello!

我们在为更加闭环、更加高效的服务模式做准备

欢迎加入限定白名单

与我们一起探索







数字人“竞技”百万身价虚拟人 柳夜熙  | 聆秋Rozy | 小K直播姬 | Ziva Dynamics 小度 | 韩国的“虚拟人”Fable | 日本的“虚拟人 | Hikky|超次元 | “十五少女”| 爱化身 | 凌迪Style3D | 虚拟演员202 | 快手狐璃璃 | 数字员工 Jinn  ... ...


Rec Room 《堡垒之夜》 |《节奏光剑》《遗忘工程师》Syn City  | 《Pokémon GO》本土游戏UGC |《黑客帝国觉醒》体育游戏 | 主机游戏 | NFT游戏 | Gala Games | 《The Sandbox》| 《糖豆人》|《Play Together》 |  《职业时代》| 《Grimlord》| 《NFT ALL Stars》| 《方寸幻境》 | Gym Class | 《派对派》... ...


Cocos | Facebook |  | 腾讯 | 百度 | 微软XGP| 迪士尼 | Epic与苹果 | 索尼元宇宙观 |  | LG U+ | Roblox | 索尼 VTuber | 英伟达 | Unity | 育碧Scalar 腾讯云 |  派拉蒙 | Epic | Adobe | 集英社 | Discord |PICO |Vertigo Games | LayaBox ... ....


世悦星承次世文化|火山引擎| avatar动图宇宙 |Inworld AI | Synthesia | Burlingame Studio | Liv |Twitch | Brave Group | Hour One  | 粒界科技 | Wonder Interactive |Sequin AR | Motion Matching | NTT XR | 三丽鸥 | Dark Slope| Atoms Labs|Space Date ... ... 


聂辉华教授| 王国成教授 | 姜进章教授 | 臧志彭教授 | 稻见昌彦教授 | 华策影视集团总裁 傅斌星 | Layabox创始人谢成鸿 | 陈永东教授 | 博采传媒创始人 李炼 | 七创社董事长 许怡然 | 蔚领时代 郭建君 |OUTPUT 刘茵梦... ...


AR市场趋势观察 海外产业观察  | 日本市场 | 全球芯片 |  韩国NFT | 体育IP进军元宇宙  | VR虚拟试驾 | Authentic Artists |  五感交流 | 3D 虚拟社交| VR开发工具| 元宇宙“综艺” | AIGC工具 | 体育产业 | ... ...