谷歌最强 AI 大模型:Gemini 终于发布了!暴打 GPT-4, 读写样样精通

1.Gemini 官网:【链接直达

2.谷歌Bard:【链接直达

谷歌Gemini背后技术的杀手锏,便是原生多模态(natively multimodal)。

因为以往创建多模态大模型的方法,通常是为不同的模态训练单独的组件,然后将它们拼接在一起,大致模拟其中的一些功能。

这样训练出来的模型虽然有时可以很好地执行某些任务(比如描述图像),但在面对更具概念性和复杂推理的情况下,就会出现表现不佳的结果。

而谷歌Gemini所强调的原生多模态,是指从一开始就对不同的模态进行预训练,然后用额外的多模态数据对其进行微调,以此来进一步完善大模型的有效性。

具体来说,此次谷歌一共带来了Gemini的三个版本:

  • Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务
  • Gemini Pro:可扩展至各种任务的Gemini模型
  • Gemini Nano:适用于端侧设备的高效Gemini版本(1.8B/3.25B)

其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平

而Gemini Pro从今天起,就会在Bard中实装上线。


Gemini 是一个由谷歌开发的大型语言模型,于 2023 年 12 月 7 日宣布。它有三种不同模型尺寸:Gemini Pro、Gemini Standard 和 Gemini Lite。

  • Gemini Pro 将于 2023 年 12 月 13 日开放,面向所有用户。
  • Gemini Standard 将于 2024 年第一季度开放,面向经过验证的开发者和企业用户。
  • Gemini Lite 将于 2024 年第二季度开放,面向所有用户。

具体来说,Gemini Pro 将与 Bard 集成,让用户可以体验到 Gemini 的强大功能。Gemini Standard 和 Gemini Lite 将提供更广泛的功能,包括生成文本、翻译语言、编写不同类型的创意内容等。

以下是 Gemini 的开放时间表:

模型尺寸开放时间开放对象
Gemini Pro2023 年 12 月 13 日所有用户
Gemini Standard2024 年第一季度经过验证的开发者和企业用户
Gemini Lite2024 年第二季度所有用户

drive_spreadsheet导出到 Google 表格

请注意,Gemini 目前仍在开发中,其功能和性能可能会有所变化。

发表评论