谷歌最强大模型Gemini能否打败GPT4?

"沉寂"已久的谷歌终于放大招了。

美国当地时间12月6日,谷歌发布多模态大模型Gemini。谷歌DeepMind直接宣布,Gemini是“谷歌最大、最强的人工智能模型”。

Gemini谷歌是从头开始构建的多模态模型,这也是更接近人类认识世界的方式。

作为谷歌用来应对GPT-4的“杀手锏”。Gemini在32个多模态基准测试中取得了30个SOTA(State Of The Art,即当前最优效果)的记录,是第一个在MMLU(大规模多任务语言理解)测评上超过人类专家的模型。Gemini在此项取得的成绩是90.0%,作为对比,人类专家的成绩为89.8%,GPT-4为86.4%。

Gemini共有三个版本:

Gemini Ultra:适用于高度复杂的任务; Gemini Pro:适用于扩展至各种任务的Gemini模型; Gemini Nano:体量较小,适用于特定任务和移动设备。

comparison

"Gemini的多样性让它能够在从移动设备到大型数据中心的所有设备上运行。"谷歌DeepMind产品副总裁Eli Collins说,“我们离新一代人工智能模型的愿景越来越近了。”

“有了人工智能,我们将有机会以更大规模做一些重要的事情。”谷歌CEO Sundar Pichai在谷歌成立25周年公开信中就特意提到了人工智能。面对强势的OpenAI,优等生谷歌需要一款现象级产品,证明自己在人工智能领域的实力。

在运算效能方面,Gemini几乎“全面吊打”GPT-4。Gemini Ultra在大模型研发被广泛使用的32个学术基准测试集中,在其中30个测试集的性能超过此前SOTA结果。其中,在多选问题、数学问题、Python代码任务、阅读等方面,Gemini的性能都超过了此前最先进的水平。

谷歌称,他们对MMLU采用了新的基准方法,使Gemini能够利用推理能力在回答难题之前进行更仔细的思考,相比仅仅根据问题的第一印象作答,Gemini的表现有显著改进。

Gemini Ultra在多个编码基准测试中表现出色,包括HumanEval和Natural2Code。其中仅Gemini仅在HellaSWAG数据集上的测试逊色于GPT-4。

此外,在多模态方面,Gemini Ultra在新的MMMU基准测试中取得了59.4%的最先进得分,突显了其多模态性和复杂推理能力。

在图像基准方面的测试中,Gemini Ultra不需要从图像中提取文本就能进行OCR处理,表现优于之前最先进的模型。

comparison

不要错过富源更多关于融资、科技和商业趋势的精准信息,最新动态和深入分析。立即点击 这里立刻订阅富源

相关资讯

政府出资$2400为你的企业数字化转型和升级

CDAP申请条件及流程: (1)micro–grant 小额资金 – “Grow Your Business Online” 政府扶持的金额:符合条件的企业将获得高达 2,400 加元的小额赠款,以帮助支付与采用数字技术相关的成本。 赠款将通过加拿大各地的本地和区域服务提供商提供。 服务提供商还将支持电子商务顾问网络,他们将为小企业采用电子商务提供建议和帮助。 企业申请所需的要求: 申请流程:

详细内容

寻找风投:.406 Ventures VC

美国波士顿有一家风险投资公司始终保持着低调而高效的姿态,它就是 .406 Ventures VC。今天,我们来深入了解这家神秘的投资机构。 .406 Ventures VC 不仅以其精准的投资眼光著称,更以其对初创企业的深度支持和指导备受赞誉。 # 投资领域 明确投资3个领域: 健康科技,网络安全,数据分析到云计算。 该公司的投资组合包括了一系列令人印象深刻的企业,每一家都在其领域内展现出

详细内容

寻找风投:SWO Angels:加拿大南安大略的天使投资集团

SWO Angels 是一家位于加拿大安大略省的天使投资集团,专注于为初创企业提供资金和支持。作为一个活跃的投资者,SWO Angels 主要面向以下条件的公司: - **客户吸引力**:年收入至少10万加元,或在三个月内有很高的可能性与战略客户达成销售 - **可扩展性**:利用创新技术快速增长客户和收入 - **可解决市场规模**:每年至少1亿加元 - **市场地理位置**:全球 - **

详细内容