对话傅盛大模型的世界不只有爱因斯坦,还有

北京治疗白癜风的医院 https://jbk.39.net/yiyuanzaixian/bjzkbdfyy/ffxbdf/

作者|张小珺

出品|腾讯新闻《潜望》

最近无论走到哪儿,傅盛都在包里装一台Mac电脑,空闲时让ChatGPT教他写程序。

ChatGPT替代了书籍。“我最近都没怎么读书了,天天直接就问GPT。”傅盛说,有问题找它,有论文要读丢进去让它总结,还问它各种鸡兔同笼、苍蝇和兔同笼、蜈蚣和兔子同笼的逻辑问题。

甚至,他问ChatGPT:当年Google用Bart效果不错,你们却很差,是什么让你们坚持自己的道路?

我们正处于人类技术史上的一个伟大时刻。傅盛是猎豹移动董事长兼CEO、猎户星空董事长,在他看来,这是人类第一次将电能转换成通用智力,哪怕互联网的变革意义都不能与之比肩。大模型应与蒸汽机一较高低。

同时,傅盛提出了一个新命题。就像过往每一次技术革命是从实验室里的高精尖向普及化过渡,技术的神秘面纱随之被揭开。这次的大模型会不会也这样,一部人创造“爱因斯坦式”的超级大模型,另一部分人生产“平民化大模型”?

“世界永远是这样,一段特别牛的,一段一些草根想办法去颠覆,从低端去搞你。低端这条路永远没输过,高端那条路也永远存在,所有的商业基本是这个逻辑。”他说。

傅盛是移动互联网时代崛起的创业者、一个颇为性情的CEO。过去,他会为恩怨哭、为市值不服气,也会带着多位员工坐游轮出海、去迪士尼。随着年Google下架猎豹旗下多款产品,这场剧烈的风波令其公司市值遭受断崖式下跌。另一边,早在年傅盛开始寻找新增长点并创立了猎户星空,将精力逐渐转到机器人和AI赛道,这是这次访谈的起因。

这次,我们和傅盛从这个伟大的AI变革开始聊起,也聊到了他所擅长的交互界面变革、他的最后一次创业,以及人生的起伏和心性转变。如今,他放下了很多个人恩怨,反而是看到一些感动小事容易动情,理解了他人的艰辛与不易。看《新喜剧之王》他就哭得厉害。

“那就是小人物的奋斗史啊。”傅盛说。

以下是对傅盛的访谈。为了方便阅读,我们做了一些字句修改。

01

做大模型有两条路:

造一个爱因斯坦vs平民化大模型

腾讯新闻:ChatGPT爆火后,整个社会对人工智能达成共识有点太快了,这几个月你的生活有变化吗?

傅盛:我现在出门就要背一个Mac电脑。让ChatGPT教我写程序。

大语言模型大家核心要理解的是:它不是聊天工具,不是知识库,而是通过对知识学习建立一整套逻辑能力。逻辑能力是人类独有的。

达成共识这么快,是因为大家认为这是人工智能第二个里程碑。第一个里程碑是AlphaGo突破了机器人识别,但识别不是人和动物的核心区别,狗、猩猩也会识别;逻辑能力才是人的核心,也就是所谓“智能”。第二个里程碑难度比第一个大,到今天也没有完善理论能证明,现在有个词叫“涌现”——这是为什么只有OpenAI当时选这条路——如果有理论证明只要加到亿参数就能产生智能,大家早就上了。

腾讯新闻:今天能证明这件事吗?只要加到亿,其他人能复制。

傅盛:这条已经趟通了。现在这么多做大模型,都能做个大概。

腾讯新闻:你们会做吗?

傅盛:我们现在不会。这是“大平台的核战争”,你走跟它一样的路,肯定被它碾碎。

我认为大模型会分两条路。一条叫越来越牛的大模型,是“造一个爱因斯坦”。谁都怕“爱因斯坦”出来,大公司都得上,不断进行“核战争”——从GPT-3.5到GPT-4再到多模态。

但很多工作岗位不需要“爱因斯坦”,大学毕业生就能做。这是另一条路。业界最著名的是“羊驼”,几十亿参数、一块GPU卡训练出的效果,在一些专业领域也不错,实现快速平民化落地。我们可能走第二条路。我们从去年底开始推进与机器人的结合,近期会出产品,具体做法不能说太多。我相信一定有大量的人做“平民化大模型”。

腾讯新闻:如果“爱因斯坦”出来,会不会对其他是一种碾压?

傅盛:这个问题今天我没有确切答案,但从逻辑上不那么可能。因为它的成本。“爱因斯坦”永远需要更大的参数、更好的算力、更贵的服务。你看GPT-4比3.5,服务首先慢,其次收费,还限制条数,现在在封账号。当然你说如果到了终级状态是不是有又便宜又好用的,可能有,但这种状态会持续很长时间。

3-5年肯定会。你就这么想,GPT-5年底发布,从GPT-4到5一年过去了,明年再来个6。到现在GPT-4发布两个月,非但速度没有快,反而在裁减用户。

腾讯新闻:能不能试着精确定义一下“平民化大模型”?它和大模型所需要的条件差异是什么?

傅盛:参数量会少,数据量不会那么高,在一些特定领域能达成某种效果。一定要把模型叫做一种逻辑能力,在某种领域的这种判断力,门槛没那么高。最后竞争力来自场景、应用,在某个行业深入了解需求。

你都把文档传给一个大模型,数据安全是不是有问题?以后会不会有私有化部署的大模型?如果有,GPT-4那么消耗算力,谁部署得起?一定会有便宜、但能力不错的出现。

世界永远是这样,一段特别牛的,一段一些草根想办法去颠覆,从低端去搞你。低端这条路永远没输过,高端那条路也永远存在,所有的商业基本是这个逻辑。

腾讯新闻:可以简单理解,这个世界不只有爱因斯坦,还有很多一本、二本毕业的人。

傅盛:现在的GPT-3.5说是9岁智商,GPT-4到10多岁,以后像爱因斯坦。这个技术一旦被趟通,有很多人研究它。以前没人研究,所以第一波上了一定不是最优方案,有很多可优化的。慢慢优化发现,比较便宜的模型也能实现中学生或本科生的智力水平。

当然,这里有一个东西得看——没有足够的参数是不是能涌现这种智能?是不是亿是个槛?

腾讯新闻:是不是呢?

傅盛:不知道。我觉得可能不是,可能只是亿试出来了,后来发现亿也不错,以后亿也还可以,就训练一个垂直任务——好比回答我们公司的客服问题,地球怎么样你不用管。

腾讯新闻:大模型看起来非常难,为什么还是有这么多人涌入?

傅盛:它没有非常之难。语义理解有两条路:“教育”神经网络和神经网络“自学”。凭直觉第一条路是对的,教它语法结构、知识图谱,教足够多,就把语言搞定了。比如教它“中国”、“北京”、“首都”这几个词的关系,不断有人帮它整理——就跟我们学外语一样,你过了四级、六级、八级,是不是就掌握外语了?实际这条路最后走不通。

第二条路是扔给它,让它自己学,小孩扔在一个环境里就学会了。这条路大家没见过,它没有严格理论支撑。第二条路它文本越多,要烧的钱越多,OpenAI都把非盈利变成盈利了,20亿美金已经砸进去。你说全球几家公司能在看不到前景的情况下投20亿美金?

腾讯新闻:有人说,大模型只有博士、豪华学历的人组团队才能做。

傅盛:年,我们组建人工智能团队,那时人挺贵的,做的语音效果不错。到年,一个普通做人工智能工程师的工资可以一年涨2-3倍,外面挖人是double或triple挖,不涨工资留不住人。我们人才大量流失。

这个事完了以后,我们冷静看了看,那段流失反而对我们是好事。流失完我们留下一些较普通的人,也做出了不错效果。我意识到,所有技术都是从大家不知道向普及化的过程。我当时招那个头儿跟我说,这东西只有博士能干。我在猎户星空招过的博士比我之前见过的博士都多。后来博士走得差不多,我们就搞了一些好的本科生,也能干——慢慢神秘的面纱被揭去了。

对学历,开创性要求很高,但它一定会降下来,这是我为什么坚定“平民化大模型”会出现。

腾讯新闻:对创业公司来说,造“中国OpenAI”的船票是什么?

傅盛:那天跟他们(通用大模型创业团队之一)聊,觉得这个事创业公司要做,估值要很快拿到20亿美金。如果融不到那么多钱,就不要谈了。当然这只是他们的看法。

02

大模型的意义:可与蒸汽机比肩

人类历史上第一次把电能转换成了通用智力

腾讯新闻:在互联网时代,一些平民化公司长成了巨头,大模型时代的创业环境跟那时一样吗?如果不一样,不一样在哪?

傅盛:不一样,巨头已经长成了。移动互联网时代也没有出现几个大巨头,还是互联网时代起来的。互联网把信息链接起来,那帮巨头千年不老的感觉。

腾讯新闻:我看到你说,如果今天没有大模型,就不能说自己是平台公司,这句话能展开讲讲吗?大模型未来会出现中国OpenAI这种公司,还是只是各个公司像云一样的板块,是巨头的叠加?

傅盛:大模型会变成平台公司的底层操作系统,也会成为用户的操作系统——本质是操作系统。举个例子,如果有一天我们买机票或叫外卖,不是从某个App上叫,而是我晚上6点回家,要一份香辣鸡翅,手机帮你准备好了,现在那些巨头价值会降低很多。大模型调度给谁就是谁,谁靠近用户谁就有调度力。为什么微软对OpenAI这么重视?是它操作系统重构的核心点。

我们一直在争论,到底以后是一个语音助手够了,还是多个?现在没有结论。用户习惯很难摸清。当然,有些提供服务的公司,比如一些专业公司,跟大模型合作就好了。但会不会一部分用户选某一家,另一部分用户选某一家?只能说有可能。局势怎么演变还看不清楚。

腾讯新闻:今天相当于互联网或移动互联网的哪个时候?是iPhone时刻还是有人说的黑莓时刻?

傅盛:肯定是iPhone时刻,跟黑莓没啥关系。现在除了它一本正经胡说八道,其他技术条件都具备了。但这次有巨头微软加持,会比iPhone还快。你要知道,微软去年9月就看到GPT-4的效果,比尔·盖茨不都震惊了嘛。

腾讯新闻:之前是大家不认为这事能成,OpenAI成了;现在大家都认为这事能成,会发生什么?

傅盛:就是“核战争”。阿里发大模型,没有知识图谱的包袱(即“教育”神经网络的第一条路),反而可能重新构建。你在原来做了大量知识图谱,这套体系舍不得扔,扔了要从头开始。但以前的知识图谱、切词技术都用不着了,现在唯一要管的是:数据怎么更干净,它吃哪类数据效果好,中间哪些Transformer是开源模型,做哪些所谓参数调优能让它更好,训练速度怎么更快——把原来的积累都打掉了。这是Google这么紧张的一个原因。

腾讯新闻:知识图谱没有用。

傅盛:真的没有用。

腾讯新闻:你是移动互联网时代优秀的产品经理,大模型依次和哪些业务场景匹配度高?未来会怎么演变?

傅盛:第一波是搜索场景。

腾讯新闻:如果Chat和搜索在一个入口,Chat会分食很多搜索的流量。

傅盛:对,以后可能不是分流,有可能你首先看到是综合的——就像你打开一本书,看到里面各种,底下列参考资料,你自己要看就去看,不看拉倒。以前我们是看完参考资料自己总结前面这段内容,现在等于总结了前面这段内容再给你参考资料。

第二个场景是办公,大量的白领在办公,微软就是这样做的。

腾讯新闻:社交呢?

傅盛:短期不会有太大影响,以后可能是我的助理和你的助理沟通。这对于它今天不是刚需,但


转载请注明:http://www.aierlanlan.com/grrz/5732.html