我们在上篇文章中提到,谷歌已经向一些外部公司开放了多模态大型模型Gemini并进行内测,并有望在近期正式推出。链接:Google新AI模型Gemini即将推出,爆算力超过GPT-4五倍,能否打败OpenAI?
然而,OpenAI不会坐以待毙。根据The Information爆料OpenAI正在紧锣密鼓地筹备一款名为Gobi的全新多模态大型模型,计划在谷歌推出Gemini之前发布,以将谷歌彻底击败。
OpenAI正在将多模态功能融入到GPT-4之中,目的是在Gemini发布之前推出多模态大型语言模型(MLLM),即代号为Gobi的下一代大型语言模型,以击败谷歌并继续保持领先地位。谷歌的Gemini已经进入内测,正在与选定的企业客户进行测试,正式推出就在不日之间,OpenAI似乎并不打算让谷歌轻易占据多模态大型模型领域的领先地位。
多模态大型语言模型近来成为研究热点,它利用强大的大型语言模型(LLM)作为“大脑”,可以执行各种多模态任务。LLM展现出了传统方法所不具备的能力,比如能够根据图像创作故事、视觉知识问答、无需OCR(光学字符识别)的数学推理等,从自然语言理解到图像解释等,提供更广泛的信息处理能力。
早在3月份发布GPT-4时,OpenAI就预先展示了这些功能:在纸上画个草图,拍个照发给GPT-4,说一声「给我按照这种布局做个网站」,它立马就写出了网页代码,但是除了一家名为“Be My Eyes”的公司外,没有向其他公司开放。
六个月后的今天,OpenAI正准备在更大范围内推出被称为”GPT-Vision“的功能。据悉,OpenAI可能会在GPT-Vision之后再推出Gobi。OpenAI花了这么长时间才推出这项功能的主要原因是担心新的视觉功能会被不良行为者利用,比如通过自动解决验证码来冒充人类,或者通过面部识别来跟踪人们。但OpenAI的工程师们似乎接近于解决围绕这项新技术的法律担忧。
当然谷歌也面临这个问题,当谷歌被问到正在采取哪些措施来防止Gemini滥用时,谷歌发言人表示他们在7月份做出了一系列承诺,以确保其所有产品能够负责任地开发。与现有的模型相比,Gemini似乎已经产生了更少的错误答案。
OpenAI首席执行官Sam Altman在最近的各种采访中暗示,GPT-5还没有出现,但他们计划对GPT-4进行各种增强,新的增强模型可能是其中之一,现在就说它最终会成为GPT-5可能还为时过早,但可以肯定的是,OpenAI正努力推出这款多模态模型,以对抗谷歌的Gemini。
在上周接受《连线》杂志采访时,谷歌CEO皮查伊表达了他对谷歌目前在AI领域地位的信心,并认可技术进步的持久性,以及他们在平衡创新与责任方面深思熟虑的战略。然而,这场竞赛就相当于人工智能版的iPhone与Android,人们正屏息以待Gemini的到来,它将揭示谷歌和OpenAI之间的差距到底有多大。
【版權聲明】
本文爲轉帖,原文鏈接如下,如有侵權,請聯繫我們,我們會及時刪除
原文鏈接:https://mp.weixin.qq.com/s/EG-K-uOIAkAjVxqjNYYnCg Tag: ChatGPT 人工智能 Gemini Pro GPT-5