白交衡宇发自凹非寺量子位,背后Omni团队被扒了个底朝天

aixo 2024-05-20 13:25:29
大模型 2024-05-20 13:25:29

白交 衡宇 发自 凹非寺

量子位 | 公众号

GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天:

领衔者,是DALL·E 2/3研究团队成员、 Law共同提出者。

更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人。

这里的“新人”,可能是本科or硕博刚毕业的应届生,也可能是刚加入的新成员。

恰如其时的,思维链作者、从谷歌跳槽的Jason Wei跳出来,分享了公司内部派活儿的原则:

派给你的活,绝不与你的职级挂钩。

换句话说,即使是初级工程师,只要有想法,就可能被委任承担大项目。

而且任命前的评判纯粹根据员工执行表现来,而不是考虑过去这人有过啥优秀业绩。

Jason Wei说,他在见过几位毕业不久的工程师,在内部揽了一个重要的大活,他那时候心想,“哇,要是谷歌,这不得让L8/L9的员工来搞?”

好一个任人唯贤!

网友看后感慨万千,感慨这样独角兽中的超级独角兽,就是需要这股子劲。

给这样的团队2-3年,你会看到他们带来的惊艳表现。

具体情况,咱们来扒一扒就清楚了——

做出伟大产品的年轻团队们

本次吃瓜活动,就从最近万众瞩目的GPT-4o背后团队(以下简称Omni团队)下手吧。

Omni团队负责人,印度小哥 (下面我们叫他PD哥)。

你可能不咋熟悉他的名字,但一说他的前作你大概率都认识:DALL·E 2、DALL·E 3、一致性模型,还共同提出了 Law。

谷歌学术显示,这哥的论文引用次数超过了72500次,还在不断上升中。

想当初,PD哥是以本科毕业生的身份加入的,虽然这个本科是MIT(手动狗头)。

他在MIT主攻计算机科学、数学、物理学,并在MIT大脑、思维和机器中心担任本科生研究员。

据PD哥自我介绍,本科毕业前,他就已经在成立不到1年的实习了,然后2017年毕业后正式转正。

我们整理发现,入职前半年,他就参与了 的团队项目。

然后次年成为了Glow的共同作者,接下来更是共同提出 Law,参与研究DALL-E 2、DALL-E 3、一致性模型等等等等。

过去的18个月里,他领衔了GPT-4o的工作。

项目面世后奥特曼狂赞他,说如果没有PD哥的远见,以及长期以来才智、信念和决心,就没有GPT-4o。

总裁Greg 也说,多亏PD哥“建立全能大模型”的信念,团队才最终搞定了GPT-4o。

夸得太卖力,一下就把PD哥推到了聚光灯下。

△GPT-4o项目负责人

PD哥自己在推特表示,GPT-4o是他们团队推出的第一个模型,也是首个原生多模态大模型。

经由PD哥在推特对团队在线点名致谢,我们发现Omni团队里有6位(疑似)华人面孔。

Yu Zhang:加入 8个月;此前在 工作6年。他本科毕业于上海交通大学计算机专业。

Chang:加入 1年;此前在呆过5年。她的学士学位是在清华大学姚班取得的。

Li Jing:加入 2年,曾是Dall-E 3、Sora团队成员。本次负责保障GPT-4o的图像生成、3D生成的能力。本科时,Jing在北大获得物理学学士学位。

Yu:加入 3年8个月,现带领感知团队;入职前参与过的、PaLM 2项目。Yu本科时就读于中国科技大学少年班,学习计算机。

Casey Chu:加入已有4年,参与过GPT-4、DALL・E 2的研究。

Mark Chen:加入 5年8个月,现任前沿研究主管,曾参与过DALL・E、GPT-4等项目。

当然,Omni团队背后还有大批共同参与者的努力。但就从上述几个人的资料来看,里面既有老手,也有新来的员工,并不会因为司龄低,就不给派重要的活。

为了佐证这一点,我们又往前再扒了扒,看看之前的项目是否如此。

看看今年春节发布的Sora。

Sora由两位博士应届生带队研究,这可称为佐证Jason Wei分享的用人秘籍的典范材料。

两位负责人,Tim 和 (Bill) 都是2023年刚刚博士毕业,团队里甚至还有00后成员。

其中,Tim是DALL-E 3作者之一,而 (Bill) 则和谢赛宁合作,搞出了Sora的技术基础之一DiT。

△带队Sora的Tim(左)和Bill(右)

看看2020年发布的。

这是一个在原始音频域中通过唱歌产生音乐的模型,参与人员就有我们刚入职没两年的PD哥。

当初没掀起什么水花,但着实为现在的GPT-4o培养了音频人才,成为了奔赴「Her愿景」的基石之一。

看看2018年发布的GPT-1。

一切故事都开始都源于万神之源《 is All You Need》论文的出现。论文发表当天,刚刚离职的前首席科学家Ilya ,就意识到“它给了我们想要的一切”。

然后建议同事Alec 开始动手研究——彼时距离Alec加入才不到2年,也是个本科生。

结果就是,开发了GPT的原型,然后调动更多人从机器人、DOTA游戏等项目转型,参与进来开发了GPT-1、GPT-2……

沿着这位本科生主导的佳作,开创了今日盛世。

△GPT-1论文主力Alec

原来是这样

不只是成员履历,其实从的组织架构上,就能感知到他们这种任人唯贤的扁平化管理方法。

最明显的是,的研究员,大家都叫 of Staff,没有啥称呼上的差异。

怪不得有网友调侃,说初级工程师也能抗大活,但可能你们就没有初级工程师啊……

Greg曾透露,他们曾认真考虑用哪种职位名称,因为不想简单将他们归为研究人员和工程师。

“ of Staff”这一说法继承自施乐帕克研究中心Alan Kay的建议。

而且整个的部门划分也没有很精细,只有数据科学、研究、安全等几个大部门。

但其实不管GPT-4、DALL·E、Sora还是最新的GPT-4o,全部都是项目制的。

整个团队从各个部门抽人组建,搭伙干活。

讲道理,在,项目归属感可能比部门归属感更强。

除了,现在很多科技公司和领导人,包括像马斯克xAI在内也都在按这套方法在搞。

现在,随着Omni团队的揭秘,关于组织架构和评判标准再次被讨论。

有网友对这种方式表示赞赏,“也是为什么我确信创始团队是应届毕业生的新出路”。

当前的市场环境下,这是满足这种雄心壮志的最佳途径,在传统稳定领域想要获得指导和成长变得十分艰难。

就像Jason Wei所说,据他观察,一般大公司会对项目有一个隐隐的期望,所以会按职级划分工作内容,项目一般都是自上而下分配的。

重要项目通常派给此前工作表现突出的“值得信赖的”L7或L8,这能保证团队有组织、高可靠性地完成工作。

但是对于一个等待大展拳脚的初级工程师来说,想要他遵守一些无关痛痒的条条框框?

不可能,绝对不可能。指望我把活干好不就完事儿了!

虽然这也是许多公司在初创期的通用做法,但事情因这次发布Gpt-4o再次曝光后,更多网友开始触景生情,破防了!

顺便再蛐蛐一下自家公司的成长体系:

别说了,羡慕。

网友自曝其他大厂不这样

一位曾在微软工作的“独立黑客”自述了此前一段伤心经历。

他本来负责一个十分具有挑战性的功能,已经做了所有前期工作,也得到设计部门的认可。但随后就被要求交给一个高级工程师。因为这个工作不符合“职级要求”。

微软的管理者都精于算计(象棋高手),他们晋升的人选都是事先决定好的,合适的项目会分配给那个人,以证明晋升的合理性。

来自谷歌的现员工和前员工们也表示,谷歌在这方面确实做的很糟糕,就是在时代也没有改善。

初级企业的层级结构扁平化,可以有更大的创新空间。

因此也有人在警示“在这方面需要加强很多工作”,有前车之鉴在此。

这样的警示并非没有依据。

事实上如今飞速发展,人才规模迅速扩展,已经开始出现一丝丝不好的“苗头”。

发布会之后,一度成为全球AI人才向往的圣地。包括像斯坦福、MIT等顶尖学术机构,微软、谷歌等顶级大厂的人才涌入。

但这当中,有不少研究类人才来了没过多久又走了,留不住。

典型如创始成员、前特斯拉AI总监 ,2023年发布后二进宫;又在一年之后再次离开,如今正在秘密开发一个项目。

还有又回到谷歌担任研究科学家的Shane Gu,仅仅只在待了7个月,其中带领团队进入了日本市场。在此之前他曾在谷歌待了四年。

2022年5月Shane Gu参与的研究发现,只要加上一句“让我们一步一步地思考”就能让GPT-3做数学题的准确率暴涨61%,引发学术界轰动。

还有其中老员工Jack Rae,曾就压缩即智能在 MLSys 发表演讲。

此前在工作一年多时间,今年7月份从跳回到谷歌,他可能是唯一一位对GPT-4和都有贡献的人类了。

现在掀起新一波离职潮,且大部分都是技术团队的人才,甚至随着灵魂人物、首席科学家Ilya官宣离职而加剧,超级对齐团队负责人也紧随其后辞职。

而另一面,关于产品、营销方面的人员加入。最新消息,他们还挖来了谷歌搜索广告业务的21年老将。

再加上,如今频繁的产品级更新、搜索引擎的布局以及同苹果Siri的合作……更多商业化操作不一而足,和奥特曼的野心由此可见。

在这样的情况之下,是否还能持续保持领先?