视频数据价值再增,合成数据成替代品,中广天择、华策影视备受关注!

导语:视频及多模态模型需要大量优质标注视频数据进行训练和优化,而合成数据可以解决真实世界数据限制问题。中广天择和华策影视作为行业领先者备受关注,其与万兴天幕大模型和视频语料展开战略合作,引起市场热议。此外,还建议关注捷成股份、上海电影等优质内容生产公司。

 

视频及多模态模型需要通过大量、高质量标注视频数据进行预训练和优化,大量优质正版视频数据许可成关键。

此外,如遇在真实世界中难以观测、标注数据获取成本较高、数据获取和处理涉及到真实世界隐私信息等问题时,合成数据有望解决AI发展应用中的数据限制。合成数据是计算机模拟技术活算法创建、生成的自标注信息,可以在数学上或统计学上反应真实世界数据的属性,因此可作为真实世界数据的替代品,来批量生产,用于训练、测试、验证AI模型。Sora文生视频模型中用到由游戏引擎合成的视频数据作为训练集。

我们重申视频数据要素对于视频及多模态模型训练的重要价值,相关标的逻辑梳理:

建议关注:

1)中广天择:主要从事纪录片、综艺、影视剧等视频内容的生产和运营,曾打造出《查找图书守护解放西》系列等高口碑综艺。公司是版权运营的先行者,依托于广电系资源,每年为全国50多家省级、省会台电视频道和400余家市县电视台提供10000集以上电视剧版权内容,近期公司已经与万兴天幕大模型签订战略合作协议,并达成视频语料方向的战略合作。

2)华策影视:公司影视剧版权数量超5万小时,目标构建中国最大的影视素材运营平台。

3)捷成股份:主要从事新媒体版权运营业务,积累超5万小时影视、动漫、节目版权内容。公司覆盖主要包括腾讯、优酷、爱奇艺、华为、咪咕等在内的互联网视频渠道,大屏TV 渠道,以及快手、头条系新型短视频平台。

4)上海电影:上美影拥有600多部动画作品,上影制片厂拥有800多部故事片、800多部电视剧资源。

同时,建议关注优质内容生产公司:光线传媒、万达电影、博纳影业

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容