导语:谷歌CEO桑达儿皮查伊宣布谷歌Gemini 1.0版正式上线,这个全新的大模型包括Gemini Ultra、Gemini Pro和Gemini Nano三个版本,具备行业领先的多项能力。Gemini是原生多模态大模型,可以无缝地理解和整合文本、代码、音频、图像和视频等不同模态的信息,具备复杂多模态推理和编码能力,有望在科学、金融、数学等领域推动快速创新突破。谷歌还将在相关产品中全面集成Gemini的能力,加速AI应用的落地。这一重大进步将推动整个AI产业的发展,建议关注谷歌产业链和相关公司。
?美国时间12月6日,谷歌CEO桑达儿皮查伊宣布Gemini 1.0版正式上线,新模型包括能力最强的Gemini Ultra、适应多任务的Gemini Pro以及针对特定任务和端侧的Gemini Nanno三个版本,新模型多项能力行业领先。
Gemini大模型是原生多模态大模型:Gemini在预训练阶段就基于多模态进行训练,原生支持多模态能力,并利用额外的多模态数据进行微调,因此Gemini可以泛化并无缝理解、编辑和整合不同模态的信息,包括文本、代码、音频、图像和视频,可以全面理解输入的信息,且能够回答与复杂主题相关的问题。
多项能力全面提升:推理方面,Gemini 1.0具有复杂多模态推理能力,可以帮助理解复杂的文本和图像信息,能够从海量数据中精准提取关键信息,因此,Gemini 1.0这种通过阅读、过滤和理解信息的超强能力有望推动科学、金融、数学等诸多领域快速创新突破。编码方面,Gemini 可以理解、解释和生成流行编程语言(如 Python、Java、C++、Go)的高质量代码,具备强大的跨语言工作和推理复杂信息的能力使其成为世界领先的编码基础模型之一。三个版本的能力大幅提升和拓展,Gemini Ultra 在大型语言模型研发被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过当前 SOTA 结果,同时在大规模多任务语言理解数据集中得分率高达90%,首次超越人类专家。Gemini Pro在各种任务上的扩展表现最佳,也将集成到Bard中并继续免费。Gemini Nano则在端侧表现优异,将首先在谷歌Pixel手机上运行。
谷歌旗下产品能力有望全面升级:谷歌将在其相关产品中全面集成Gemini的能力,包括搜索、广告、Chrome、Duet AI等。12月6日,Gemini微调版本已经集成到Bard中,可执行更高级的推理、规划、理解等任务,且升级版的Bard将在170多个国家和地区提供英语版,后续将扩展到更多模态并支持多种语言,预计2024年初Bard与Gemini全面集成。谷歌搜索在Gemini的加持下能力也大幅提升,测试显示它使用户的生成搜索体验(SGE)速度更快,延迟减少40%,同时质量也得到提升。12月13日开始,开发者和企业用户可以通过Gemin API获取Gemini Pro。
我们认为谷歌Gemini大模型是AI大模型领域的重大进步,有望推动整个产业快速发展,加速AI应用落地。建议关注谷歌产业链以及在AI应用落地方面全面布局且业绩表现亮眼的公司昆仑万维、美图公司。
暂无评论内容