2023年4月10日,原搜狗CEO王小川官宣创办百川智能——一家研发并提供通用人工智能服务的中国公司,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。
百川智能将借助语言AI的突破,构建“中国最好的大模型底座”,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠地获取世界知识和专业服务。
很多人对王小川不陌生。
王小川曾任搜狗CEO,先后主导开发了搜狗搜索、搜狗输入法、搜狗浏览器等产品,首创破局搜索的“三级火箭模式”,先后推动了阿里巴巴和腾讯战略入股搜狗,并于2017年带领搜狗在美国纽交所上市,此后搜狗被腾讯私有化收购,王小川告别搜狗。王小川先后担任第十三届全国政协委员及提案委员会委员、九三学社第十四届中央委员会委员及促进技术创新工作委员会主任、清华大学计算机学科顾问委员会委员等职务,曾获1996年第8届国际信息学奥林匹克竞赛(IOI)金牌、2014年北京市劳动模范称号、2015年北京市科学技术奖一等奖、2018年中国青年五四奖章、2019年第十五届中国青年科技奖、2019年中国电子学会科学技术奖科技进步奖一等奖、2020年钱伟长中文信息处理科学技术一等奖等奖项和荣誉。
站在多年积累之上,再创业的王小川无疑是中国AI大模型创业阵容中最受关注的人之一。王小川一直被外界称为“五道口守门员”,他来到北京二十余年,始终没有离开过清华大学和搜狐大厦所在的五道口区域。离开搜狗542天后,这一次再创业,虽然换了一个身份,但“守门之路”依然继续。
本文,甲小姐于官宣当日在五道口独家对话百川智能CEO王小川,抵达官宣背后更深一层的思考。
1.谈认知:“AGI(通用人工智能)不是OpenAI,不是ChatGPT,也不是某个产品,而是一个大时代”
甲小姐:你曾评价自己很钝感,有选择困难症,一个月前你和我说这波大模型让你感觉“被架在火上烤”,今天来看,这次创业你有多少是被时代推着走的,多少是自己主动的?
王小川:最初看到ChatGPT时,我没把它理解成一个严肃科学问题,比如你问个问题它答错了,但当你要求它“think step by step”,它就答对了,我最初觉得很好笑,直到今年1月底我开始认真看,才发现通用人工智能时代到了。
对于“该不该下场”,我可能是最后一个下判断的,但对于“这是不是AGI(通用人工智能)”,我在用完ChatGPT之后就知道了,我可能是第一个这么斩钉截铁认为它是AGI的人。
甲小姐:你斩钉截铁判断“ChatGPT就是AGI”,业界更谨慎的说法是“看到了AGI的曙光”,连微软也比你的说法保守,微软的说法是“GPT-4可被视为AGI的早期版本”。为什么你这么笃定?
王小川:就像AlphaGo出现时我很早就确信它会赢,我是看论文的人。
甲小姐:你和别人对AGI的定义不同在哪?
王小川:现在对AGI还没定义,但我是做自然语言的,我深知语言多难。我们上学时学人和动物的核心区别是语言,维特根斯坦说“语言的边界就是世界的边界”。我的判断是,当机器掌握语言,通用人工智能时代就到来了。
你也看过侯世达写的《表象与本质》,看完之后就很清楚什么叫AGI了。掌握语言, AGI就来了——这件事的逻辑清晰,不是我作为一个企业家的鸡汤说法。
只是我原来认为光从语言做大模型行不通,必须加图,但现在发现,大模型还没加图就学会了。
甲小姐:你曾在一次访谈中说“写程序是创造生命的过程”,你对健康感兴趣,对AGI感兴趣,都是对生命的兴趣?
王小川:广义上生命分几种,AGI主要指向创造智力。人最根本的需求是“生存”,我反复讲繁荣和延续人类文明,“繁荣”指向“生”,“延续”指向“存”。我说的“生命”,既不是个体的生命,也不是AGI,而是整个人类文明——让人类文明能够更繁荣和延续是我的终极理想,我希望向文明、向生命致敬。
甲小姐:你官宣要“做中国最好的大模型”,这是个具有很强竞争意味的定位。
王小川:第一,我是不怕竞争的。你也知道奥赛是怎么卷过来的,搞搜索是怎么卷过来的,我倒不怕竞争,我只是不希望过多突出竞争,但大家非得问。我觉得更好的逻辑不是竞争,是告诉大家AGI时代已经开启了。
甲小姐:现在对AGI国外也没有形成共识,比如Yann LeCun就不认同OpenAI的一些说法,他提出“世界模型”;而OpenAI CEO提出“万物摩尔定律”,大家似乎到了一个定义新世界基本定律的阶段。你认知AGI的底层逻辑是什么?
王小川:目前我的思考跟OpenAI高度一致,也许是被他们感染。接下来文字模型搞完之后,视觉还有更复杂的事情,有些不是现在能弄清楚的,现在可能是“不知道自己不知道”的状态。但我想强调的是,本质上AGI不是OpenAI,不是ChatGPT,也不是某个产品,而是一个大时代。在我个人公开信的结尾有对这件事的刻画,我还是挺满意的。
甲小姐:从年初下判断这是AGI,到今天官宣创业,仅仅过去了两个月,这两个月你见了多少人?
王小川:不到100人。
甲小姐:这两个月你的认知有变化吗?
王小川:没什么变化,主要还是靠自己思考。我自己的大脑不是一个靠各种数据驱动的深度学习系统,我的大脑就是一个pre-training model(预训练模型),我脑子里存了很多东西,pre-train之后靠大家激活。
甲小姐:未来你会推翻现有结论吗?
王小川:至少我讲的都是我比较确认的东西,肯定还有更多我不知道的细节,但我的核心观点就是“通用人工智能时代已经来临”,这比其他都重要,我很笃定。
甲小姐:你现在进入AI native的生活状态了吗?
王小川:我还得继续强化,还不够。我现在涉及工作的内容问人,语言知识信息类的都问AI。比如我想知道“从10月30号到今天总共过了多少天”,直接问ChatGPT是最简单的,做大模型创业要开媒体见面会的建议也是ChatGPT告诉我的。
2.谈创业:“把自己的名字压进去了,把朋友都带进去了,自己最后就是兜底的这个人”
甲小姐:大模型创业,你比王慧文、李开复等人的官宣晚了不少,为什么?
王小川:因为我不想什么都没有就官宣。
甲小姐:你官宣时,个人公开信落款是“百川智能CEO王小川”,之前的组合都是“搜狗CEO王小川”,我看到那个落款时有点陌生感,这是你第一次把自己的名字放进公司名称里?
王小川:当然。我也觉得很陌生,之前和别人聊,经常一不小心就说成“我们搜狗”怎么样。
甲小姐:对你而言,把名字放进去,比自己投钱更意味深重?
王小川:是的,核心就是把自己放进去。把自己的名字压进去了,把朋友都带进去了,自己最后就是兜底的这个人。
甲小姐:你很习惯价值升维,讲过很多高境界的话,比如“做输入法是帮助人类更好地表达”“做搜索是帮助人类更好地获取信息”“语言是人工智能皇冠上的明珠”,AGI会带来人类文明的“文艺复兴”等等,但创业可能有99%的时间是在面对和世界先进水平的差距,是脏活累活和权衡取舍。你已经成功了一次,再次all in,犹豫过吗?
王小川:没犹豫过。有人想做投资,而我就是要创业的。
甲小姐:这次创业目标关系到个人追求吗?比如钱、名、权力。
王小川:当你有势能去推动一件事情发生改变的时候,钱和名都不在意,只在意这件事本身。
甲小姐:官宣后你会收到很多信息轰炸,最关心什么?
王小川:我最关心的是有没有人愿意来一块儿干。
甲小姐:你的公开信留的招聘邮箱按年龄段分了组,目前团队年龄组成如何?
王小川:几个领军人物都是90年的。
甲小姐:百川团队有部分搜狗旧部,这是否会造成路径依赖?
王小川:不会。很多人可能对搜狗有误解,觉得搜索公司不够AI,其实搜狗现在有12000片GPU在跑着,70%是做推理的,搜狗是非常AI化的公司。搜狗的核心是语言相关工作,NLP是基本功,在大量文本数据中筛选高质量数据的方法和大模型是完全一样的;其次,在评价方法上,从平台输入一个问题,评价它的反馈答案好不好的标准和搜狗也相对一致,所以我们在一头一尾的原始数据治理上相对有更多经验,也更擅长对生成内容的好坏做评价。当然,大模型会涉及独有的经验和算法,但我们学起来也会很快。
甲小姐:你和业界大部分人的观点是相似更多还是不同更多?
王小川:不同的更多。很多人还是从“几板斧”的视角来考虑这件事,比如怎么搞算力,怎么搞算法,怎么找人,找人的时候大家也缺乏对生命的思考,还是在用物理方式堆明星团队。
关于招人,我的观点是不能靠“拼”团队。也许资本喜欢听把明星团队凑一块儿的故事,但公司是个生命,生命不是这么长的——它得深度融合,它的基因得交融,公司是进化出来的,拼出来的团队反而生长速度会很慢。
搭团队既要有一个融合好的团队基础,一个好胚子,也要注入更高级的基因。我最近的核心工作就是把团队理顺了,到月底我们差不多就接近50人了,下旬我就到美国去,也得去抢人。
甲小姐:你的大模型时间表如何?
王小川:第一版今年年中就训出来了,500亿参数,年底可以做到中国最好,达到GPT-3.5以上的水平。当然,这不代表我们中间没有产品发出来。
甲小姐:哪些维度可以定义“中国最好的大模型”?
王小川:基础参数量、在各个评测集上的测试效果、发布产品后的用户体验。
甲小姐:DeepMind和OpenAI虽然初始基因类似,技术都很强,但让他们拉开梯队的是DeepMind更像“AI特种兵”,把单个任务做得很好,但OpenAI最先找到了产品驱动的、scalable的玩法。所以决胜之战可能是你大模型上的“超级产品”是什么。你想清楚产品形态了吗?
王小川:我还在不断迭代,但我知道哪些东西是该有的。
甲小姐:你的超级产品会是to C还是to B?
王小川:To C,今年之内你会看到。
甲小姐:你提到会在医疗和教育两个方向做知识增强,为什么优先选择这两个方向?
王小川:语言是知识的载体。什么行业知识密集,什么行业就适合大模型。教育服务高知群体,医学生要学8年才能走进工作岗位,这明显是知识密集的两个领域。
甲小姐:和李志飞对话时,他说大模型公司的首席科学家第一年会非常难受,看到别人的“孩子”已经满地跑,自己的“孩子”还没有出生,周围很多人会不断问你孩子什么时候出生?你要权衡应该快速发布抢占时间窗口,还是更有定力先把产品做到足够好,你对节奏怎么把握?
王小川:可能看到别的“孩子”跑出来了我会有压力,但我不会难受,因为我和团队在一起,跟他们一块同进同出、同吃同住,知道他们的状态,他们的决定和我的决定是一体的。
甲小姐:重要决定不该是一把手工程吗?
王小川:是一把手工程,但要同欲同心。
(未完,回复中继续)
【版權聲明】
本文爲轉帖,原文鏈接如下,如有侵權,請聯繫我們,我們會及時刪除
原文鏈接:https://freeai-cms.battletimes.cn/app/contents/29/6523.html Tag: 人工智能 王小川 百川智能