谷歌公司在人工智能(AI)领域迈出重要一步,正式推出其最新AI模型“Gemini”,声称其性能超越了OpenAI的GPT-4。谷歌首席执行官桑达尔·皮查伊和谷歌DeepMind首席执行官兼联合创始人德米斯·哈萨比斯于12月6日在一篇公司博客文章中宣布了这一消息。
Gemini的多模态设计和技术优势
这一AI模型针对不同的规模和用例(如Ultra、Pro、Nano版本)进行了优化,能够理解和结合不同类型的信息。Gemini在数学和专业编程方面的能力相较于GPT-4更为先进,特别是在处理数学问题上的能力。
谷歌声称,其Ultra版本在30个大型语言模型开发中使用的32个学术基准测试中实现了“最先进的性能”。此外,Gemini在全面的多任务语言理解(MMLU)测试中取得了90%的成绩,超越了人类专家的表现。
谷歌首席科学家杰夫·迪恩表示,Gemini Ultra是首个在MMLU中在57个科目上达到“人类专家表现”的模型,得分超过90%。
Gemini的多模态能力从一开始就被设计成可以无缝地跨越文本、图像、音频和视频。迪恩补充说:“我们从一开始就设计Gemini为多模态模型,而不是先从纯文本模型开始,然后再事后添加视觉和音频编码器。”
Gemini在编程技能上也表现突出,能够使用AlphaCode 2这种高级代码生成系统生成高质量的代码。此外,它还能解决复杂的编程问题,并与开发者合作。
Gemini与ChatGPT的性能比较
根据人工智能专家Rowan Cheung的说法,Gemini Pro在八个基准测试中的六个中都超过了GPT-3.5,成为“目前市场上最强大的免费聊天机器人”。
Gemini Pro will be available for free in Bard and across Google apps today.
In six out of eight benchmarks, Gemini Pro outperformed GPT-3.5, making it 'the most powerful free chatbot on the market today'. pic.twitter.com/qItIey90Jb
— Rowan Cheung (@rowancheung) December 6, 2023
谷歌还在其旗舰手机Pixel 8 Pro上推出了Gemini。Pixel 8 Pro是首款运行Gemini Nano的智能手机,支持新功能,如记录应用中的“概括”功能和Gboard中的智能回复功能,目前已支持WhatsApp,未来还将支持更多消息应用。
谷歌计划在未来几个月内将Gemini部署到更多产品和服务中,如搜索、广告和Chrome。
此次发布标志着谷歌在AI领域的又一次重大突破,加强了其在竞争激烈的技术领域中的地位。