导语:谷歌因未经允许使用出版商内容训练被罚款2.5亿欧元,引发人们对大模型语料库商业化能力的关注。近期,视频和文字语料库公司备受推荐,捷成股份、光线传媒、华策影视等具备大量版权及IP的公司值得关注;智能聊天机器人Kimi Chat实现200万字内测,掌阅科技、华策影视等公司前景一片看好;国产大模型阶跃星辰研发成果优秀,各方关注度持续提升。但技术迭代进展不及预期、商业化能力不足等风险也需要警惕。
事件:
财联社3月20日新闻,法国竞争监督机构周三对谷歌(GOOGL.O)罚款2.5亿欧元,原因是谷歌在与媒体出版商的关系中违反了欧盟知识产权规则。监管机构称,谷歌的聊天机器人Bard(现名Gemini)在未通知的情况下使用出版商和新闻机构的内容进行了训练。
点评:
1、我们看好大模型需要持续用语料库训练迭代以及当商业化开始后知识产权保护规则将会为语料库们带来新的商业变现。建议关注1、视频类语料库【捷成股份】【华策影视】【光线传媒】【上海电影】【博纳影视】等手握大量版权及IP的公司;2、语言文字类语料库【中国科传】【中国出版】【中信出版】【中文传媒】【南方传媒】【凤凰传媒】等。
2、 其他方向,国内优质大模型月之暗面3月18日宣布,智能聊天机器人Kimi Chat启动200万字无损上下文内测,距离从去年10月宣布的可输入20万汉字的智能助手到今日的200万字,仅用了不到半年时间。建议关注【掌阅科技】【华策影视】等公司。
3、 近日前微软亚洲研究院姜大昕创立国产大模型阶跃星辰,公司成立于23年4月,已经完成了千亿参数语言大模型和多模态大模型的研发,这些模型在图像理解、多轮指令跟随、数学能力、逻辑推理、文本创作等方面表现出色,值得持续跟踪关注。
风险提示:技术迭代进步不及预期;产品商业化能力不及预期等。
暂无评论内容