李彦宏,AI到深处_余凯_深度_OpenAI
原标题:李彦宏,AI到深处
图片来源@视觉中国
文 | 互联网白话,作者 | 梁应杰
文 | 互联网白话,作者 | 梁应杰
对创始人李彦宏来说,周四的台子有点小了。相比每年一度,动辄开一辆SUV上去的AI开发者大会,中国版ChatGPT的发布更像是一场小型的读书会。李彦宏略带颤抖的声音也透露出一个信号:即便是全球首发对标ChatGPT产品的大厂,还是在努力追赶OpenAI的路上,或者说,还没完全准备好。
但百度是有资格成为一个挑战者的。过去10年,他们已经在AI领域投入了至少1000亿人民币,而且投入的意愿和速度明显提升——自2020第四季度以来,连续9个季度把20%的核心收入花在了技术研发上。横向对比谷歌,这一数字是14%,押中OpenAI的微软比谷歌还要低两个百分点。
那会儿,对技术敏感的李彦宏应该已经嗅到了奇点来临的味道。就在2020年5月,OpenAI发布了GPT-3,将训练参数扩大了近120倍,让这个通用模型好用了起来,尽管笨拙,但前景豁然开朗。
展开全文这个“奇点”不光是技术层面的。30年前,李彦宏在美国留学的时候上了一门人工智能相关的课程,导师特地叮嘱他们不要太痴迷:“那些东西不可能赚钱的。”
“架不住我喜欢。”后来,李彦宏在公开场合有过一个霸道总裁式的表态,AI就是自己那道菜,“我觉得人工智能这个机会是我的,我既喜欢这个东西,又擅长这个东西。”他曾在《智能革命》一书里预言,人工智能会踩着互联网和移动互联网的步伐,上演王者归来。
只是王者归来的确好看,代价却往往超出预期。
一次成功的演示和一场失败的拍卖
2012年9月,的所有产品经理都收到了李彦宏的一封邮件,要求他们关注人工智能的最新进展“深度学习”。那时,这一方向还不是主流。李彦宏也是从新成立的多媒体部的负责人,一个叫余凯的海归那里了解到最新动向的。
余凯确实了解和老板,他演示的是深度学习对于搜索质量的显著改进——10年后,微软也将GPT-3.5率先用于自家的搜索引擎,谷歌拉响了红色警报。
当年李彦宏受到的冲击也不小,除了发内部邮件,3个月后他还指派余凯参与了一场世纪拍卖,争夺被称为“深度学习之父”的杰夫·辛顿和他的两名学生的去留——那一年他们研发的算法模型AlexNet显著提升了机器识别的能力,将深度学习往前推动了一大步,意义丝毫不亚于后来横空出世的AlphaGo。
最终,百度和谷歌给出了一样的4400万美元“天价”,辛顿选择了更能避免舟车劳顿的谷歌。
借助这场拍卖,深度学习从象牙塔里不受待见的学术研究,变成了引发科技公司军备竞赛的“导火索”。
这场拍卖让李彦宏意识到了全球顶级科技公司对AI人才的渴望,进一步下定了拥抱AI的决心。半年后,在加州库比蒂诺, 距离如今苹果总部不远的地方,深度学习研究院(IDL)正式亮相,李彦宏亲任院长,余凯担任常务副院长。
对于成立研究院,李彦宏解释说,“深度学习这一波起来之后,我觉得是完全不一样的东西。它需要在理论上、算法上,在很多方面有长远的布局和突破,所以从那个时候开始,我们大规模地投入去吸引人才,去推进算法,才决定做研究院。”
多年后,围绕AI成立研究院,成了国内科技公司的标配。
AI大神们的国内落脚点
回过头去看,当初被视为天价的4400万美元,真的是个小数字。当时,为了探听更多消息,余凯频频往辛顿房间跑,负责开门和接待的是辛顿的两位得意门生,其中一位叫伊利亚·萨特斯基弗,他就是后来OpenAI创始成员和首席科学家。
但最终,和OpenAI走到一起的,是那场拍卖里提前放弃,中途又折返回来,加价到2200万美元再次放弃的微软。
竖起的AI大旗开始猎猎飘扬。在余凯的张罗下,IDL很快成了众多海外AI大神的落脚点。
张潼,拥有斯坦福大学计算机博士学位,先后任职IBM、雅虎研究院。他和余凯一起参与了2012年的“龙星计划”,为清华大学和中科院计算机所讲“机器学习”。一年后,加入IDL,从事机器学习算法研究和开发,一度担任研究院副院长。
徐伟,余凯在NEC的老同事,在深度学习领域浸淫多年,加入前在facebook创建并负责大规模推荐平台。他曾是内部唯一获得“杰出科学奖”称号的人。
2015年,徐伟成为了异构计算团队的主要负责人,负责深度学习平台PaddlePaddle的开发以及算法的研究。这个中文名为“飞浆”的平台,孕育了后来的文心大模型,才有了“文心一言”。
当然,咖位最大的还是2014年5月加入的吴恩达。就在一年前,他和同事完成了“Google Cat”的实验,让机器用一周时间浏览YouTube视频,在没有提示和“无监督”的状况下,自己认识了猫。人工智能的发展就此翻开了崭新一页。
吴恩达加入,主要负责“大脑”计划,担任公司首席科学家及IDL院长。当时美国权威杂志《麻省理工科技评论》感慨:“将领导一个创新的软件技术时代,更加了解世界。”
但还没等这个预言实现,吴恩达就离开了。在的三年里,借助他的影响力,中美人工智能团队增长到了1300人,AI也逐渐应用到各个业务层面,确立了探索无人驾驶、自然语言处理和语音交互等底层技术的大方向。
他还一度成为李彦宏之外,又一个面向公众的代言人,带着小度机器人亮相《最强大脑》,打响了小度的知名度,最终离去时,留给一个野心勃勃的2017年。
All in AI
2017年7月5日,北京国家会议中心,一个瘦小的身影在AI开发者大会舞台上坚定地喊出:“All in AI!”这个人,就是陆奇。
关于他的传奇故事,可以单独成篇,讲上好久。彼时,他已告别微软加入近半年。据他后来讲述,当时比尔盖茨为了挽留自己,表示:“能给你什么,我都给你。”他的回复恰好是曾经的全球首富都给不了的:“中国。”
陆奇和人工智能的缘分早在大学时就种下,复旦毕业的时候,他在毕业纪念册上写了一个“陆氏猜想”:HI= C⊃HB(H:Human I:Intellectualized C:Computer B:Brain),翻译过来:人类会让机器智能化且远胜人脑。
李彦宏找陆奇来是想彻底改造百度,为此他一度退居幕后。这场发布会上,俩人确实配合默契。镜头一转,李彦宏开着一辆无人驾驶汽车上了北京五环,眼神犀利的网友发现,车子实线并道且没开转向灯。接下来李彦宏还真的因此吃到了罚单。
这场热闹、激情又充满冒险气息的发布会,是2017年整个国内AI行业的缩影——一年前,AlphGo的出现让全球的AI产业为之一振。
提出“All in AI”半个月后,国务院印发了《新一代人工智能发展规划》。随后,BAT里的另两家也出手了:腾讯提出了“AI in All”的战略,主导者是从离职不久,加冕腾讯AI Lab负责人的张潼(现已离职)。同年11月,阿里成立达摩院,AI是他们布局的重中之重。另外,华为也发布全栈全场景AI策略。
那一年,被称为中国的AI元年。
然而,每个“元年”背后无不是泡沫飞溅,等狂热过后,多是一地鸡毛。
四万人的失恋
陆奇上任后很快举刀改革,按照使命、主航道、护城河三个要素为划出了四个象限,和人工智能相关的业务被归为主航道+非关键使命,关键使命+主航道的定位给了移动搜索、feed流和手机。
从这点上看,认可AI未来的陆奇并不狂热。他通过对人员的调动和业务梳理,让聚焦到“夯实移动基础,决胜AI时代”两条主线上来。至今,依然沿着这一策略前进。
后来,有人将陆奇离开归咎于他的战略失误,过于激进地All in AI,其实有失偏颇。相反,陆奇试图扭转当时日益严重的大公司病,一系列举措提振了员工的士气,很快带领走出业绩低谷。
在他到来的2017年第一季度,营收增幅仅为6.8%,随后一路回升,第四季度的增幅为29%,2018年一季度增幅达到31%。在此期间,的市值从不到500亿美元,最高冲破了900亿美元。
在陆奇到来前,因为2016年的魏则西事件,深陷舆论漩涡。在外界看来,这是一家为了利益“不择手段”的广告公司。陆奇到来之后,果断裁撤了医疗事业部,“All in AI”的口号更像是他的策略,用于扭转内部颓势和外部看法,树立是一家技术公司的形象。
然而,这轮改革仅仅维持了486天,以陆奇毫无征兆地离去告终。有员工感慨,陆奇的离职是一场四万人的失恋,股价也在短期内蒸发了100亿美元。
离开百度后,陆奇有一段时间把重心放在YC中国,支持中国本土创新创业上。他与YC创始人保罗·格雷厄姆曾是雅虎的同事,在YC创立前还受邀做过一次分享。
在那场分享会上,陆奇认识了一位年仅20岁的年轻人,用“不同凡响”形容对他的第一印象,认为他有才华和思想高度。这位名叫山姆·阿尔特曼的年轻人,就是后来OpenAI的创始人。
主导对OpenAI投资的微软CEO纳德拉曾视陆奇为得力干将。正是在陆奇的带领下,微软的搜索引擎bing(必应)在几年内将份额从7%扩大到18.6%,让竞争对手谷歌直呼“没想到”。在微软,陆奇也一度作为“四大天王”之一,负责包括Office、bing、Skype等重要产品线。
本周,GPT-4发布,微软将它率先融入了bing和Office,40年前的那个“陆氏猜想”往前踏出了一大步,早早入局的陆奇却已成看客。
当头一瓶凉水
吴恩达和陆奇两位国际公认的顶级科技人才的先后离去,也反映出AI人才不断流失的窘境。这个曾经中国AI顶级人才的蓄水池,慢慢变成了中国AI人才的“黄埔军校”。
曾有媒体做过梳理,以陆奇离职为分界往前推3-4年,有近40位AI大牛改换门庭,其中就包括创立深度学习研究院的功勋余凯,负责无人车项目的另外两位高管倪凯和王劲,以及前文提及的张潼、徐伟等人。
除了内部原因,这也是AI逐渐成为科技巨头重仓对象,开打人才争夺战的必然结果。眼下OpenAI的300多名员工里,来自谷歌的员工占比超过六分之一。
有相当一部分人从离开,没有投入腾讯、阿里、facebook等大厂的怀抱,转而创业,开启更大的冒险之旅,其中的大部分奔向了无人车的赛道。如今中国无人车行业的半壁江山,核心成员都和有关。
而的霉运没有止于陆奇的离去。一年后,同样在AI开发者大会现场,一名男子在李彦宏演讲时冲上台,往他头上倒了一瓶凉水。李彦宏一边抹去脸上的水,一边质问:“What's your problem?”(你有什么问题?)随后,他回归演讲正题,以一句“在发展AI的道路上总会遇到挫折”赢得了满堂喝彩。
倒在李彦宏头上的凉水,也倒在了AI全行业身上。实际上,自2018年DeepMind发布AlphaZero,也就是升级版AlphaGo之后,整个AI领域就陷入了沉寂。原本被视为AI重要落地,带来大规模商业化的无人驾驶技术也频频碰壁,主导这场变革的特斯拉广受质疑。2019 年初,谷歌旗下的自动驾驶企业Waymo估值被下调40%
2020年初,猎豹全球智库的报告显示,AI企业融指数量在经历持续18年的连涨之后,经历断崖式下跌。与2018年相比,2019年的融资额下降了34.8%,融资数量骤降4成。再加上疫情的影响,深度学习“寒冬论”再次甚嚣尘上——对大部分人来说,只有不断出现ChatGPT或者AlphaGo这样的超越认知的“新物种”,才能强化对深度学习的关注与信心。
这也难怪,人工智能从一开始就诞生在“无人区”,从它提出至今,也不过67年时间,而人类足足花了4.5亿年才看清这个世界。
就像李彦宏所说,“在发展AI的道路上总会遇到挫折”,而且在这个过程中,多数人关心的只是烟花升空爆炸时的那一刻绚烂,忽视了从量变到质变的过程。
百度必须应战
这个过程包括,2017年,谷歌推出了Transformer深度学习模型,打开了通向通用人工智能的一扇门。后来的GPT就是建立在它之上。一年后,谷歌又基于Transformer推出了预训练模型Bert,让搜索引擎更懂人类。
在Bert介入前,你在谷歌上搜索“如何在没有马路的山上停车”,谷歌会告诉你“如何在山上停车”,会忽略“没有马路”这回事,但在Bert介入后,它给出了更精准好用的搜索结果。
所以,现在大家为之欢呼的“生成式搜索”在2018年就初露锋芒。而且早在2012年前后,吴恩达就对谷歌的高层建议,将深度学习和搜索结合,能获得更好的结果——这点,和余凯跟李彦宏演示的一样。
将“生成式搜索”落地,比谷歌要果决很多。去年,几乎与ChatGPT发布的同一时间,发布“文心百中”,意为搜得准确、百发百中,背后就是文心大模型。而这个大模型的起点,就是2019年3月,发布的文心ERNIE 1.0系统,它基于BERT模型,进行了优化设计。
“文心一言”的发布会上,李彦宏提问,林则徐和曾国藩差几岁,机器很快给出答案,其实此前通过百度搜索已经能直接得到结果。
百度选择“挥刀向内”,因为中国的移动互联网竞争过于激烈,大量用户改变了搜索习惯,微信、小红书、知乎等平台对百度的市场份额造成了极大冲击。即使没有ChatGPT的出现,百度也要积极寻求搜索的变革,只不过现在不得不加快进程。
李彦宏曾说不怕比自己强大的对手竞争,怕的是杀出来的一匹黑马所带来的颠覆性变革,他也预见到了“这种变革更可能来自比我们体量要小的企业”。
撇开这股危机意识,曾经的BAT三巨头,已经掉队好久好久。同在港股上市,如今的市值不到美团的二分之一、阿里的四分之一、腾讯的八分之一。一直以来,被诟病技术还行却缺乏商业和产品远见,现在有机会在自身最熟悉的搜索领域打个翻身仗,没有理由不倾囊而出。
当然,李彦宏骨子里的技术信仰也不允许在国内最早布局AI并且喊出“All in AI”的,落后这场被赋予“奇点来临”意义的变革。
为什么不是科技巨头?
在三天前的发布会上,李彦宏说“文心一言”是过去努力的自然延续。回望过去10年在AI上的探索,无论是创立深度学习研究院还是招揽吴恩达、陆奇,包括一系列研发和投入,几乎紧跟行业深度变革的每一步,但遗憾因为种种原因没能诞生自己的AlphaGo和ChatGPT。
不过,倒也不必因此苛责百度或者国内任何一家大厂。毕竟,强如谷歌也没有催生出AlphaGo和ChatGPT,前者和他们收购的DeepMind有关,但DeepMind一直保持着相当的独立性,拿着谷歌的钱,用着谷歌的算力,却不想轻易分享技术,生怕谷歌拿着它们做坏事。
为什么近10年,主导人工智能大事件的都是创业公司,而不是具备更多人才和资源储备的科技巨头?
谷歌很早就知道,深度学习能大幅提升搜索的准确率,但这也意味着它将影响现在搜索引擎的广告模式。目前,谷歌每年依靠搜索产生的收入就超过千亿美元,在欧美国家占据了90%的市场。
而对于市场占有率只有3%的微软bing来说,借助OpenAI的成果抢占搜索市场,哪怕提升1%都可能带来可观的收入。
即使是技术主导的成熟公司,在拥有一定规模和稳定营收后,也会趋向于开展延续性技术,而不是大幅投入颠覆性技术,这就是创新者的窘境。未来,他们往往在面对颠覆性创新时摇摇晃晃,甚至被淘汰。拿百度和微软来说,两个PC时代在各自领域的王者,都差点被移动互联网抛弃,更典型的例子就是诺基亚。
想摆脱这个窘境,一方面要在内部进行大刀阔斧的改革,像是微软在纳德拉上台后将核心业务调整为“移动和云”——他们投资OpenAI的初衷,也是推广自己的云服务Azure,同时重塑文化,治好大公司病。
另一方面就是在外面收购一家创新公司,配备资源,给予独立发展空间,让他们来弥补母公司创新能力不足。DeepMind和OpenAI就分别是谷歌和微软的代表作。
一定程度上,这些被收购的公司也分摊了母公司的创新风险。ChatGPT并不完美,很容易胡说八道,甚至不会做简单的算术,但大众对于创业公司OpenAI就很宽容。相反,被逼着亮相的谷歌Bard因为回答错了一个问题,市值瞬间蒸发了千亿美元。
李彦宏称大模型训练是“暴力美学”,需要有大算力、大数据和大模型,每一次训练都耗资巨大。就OpenAI而言,他们在2019年之前的三四年时间里,以烧掉近1亿美元为代价,才研发出了GPT模型的雏形。过去7年,他们烧掉了10亿美元。
问题在于,包括OpenAI和微软在内,他们到现在都并不清楚为什么在参数扩大到一定程度,机器会突然出现“智能涌现”,在识别和推理能力上实现了质的飞跃,就像上帝突然掷了一次骰子。
此前,李彦宏在多个场合给出过一种描述:“真正的AI还在哺育期,只有它真正降生的那天起,人们才能知道它的威力。”
现在似乎就是了,为这一刻等了10年的他和百度,能迎来自己的“智能涌现”吗?
责任编辑: