黄仁勋的早年经历:从台湾到美国,从寄宿学校到乒乓球天才
(一)初创与壮大
1963年,黄仁勋在台湾出生。当他九岁那年,身为工程师的黄父,为了让他接受更好的教育,便将两个儿子一同送往美国亲戚家。
黄家亲戚将小兄弟俩送到了肯塔基州的一所寄宿学校读书,但实际上这还有一半是感化学校的性质,所以那里的问题学生很多——都是因为没有其它学校可去了。于是在这里,黄仁勋不仅学会了爬墙上树、偷吃东西,甚至还学会了抽烟。
幸好这样的生活只持续了两年,黄仁勋的父母就来到了美国,之后黄家迁往俄勒冈州,黄仁勋也终于可以进入正规学校读书了。
值得一提的是,求学期间黄仁勋在乒乓球运动上显示出了惊人的天赋——这几乎让他成为了职业选手!当时,15岁的他参加了美国乒乓球公开赛,并在青年组双打赛事中夺得季军!
但是,更热爱技术的他,最终还是放弃了爱好,在高中联考后进入了俄勒冈州立大学的电子专业读书。1983年毕业后,又前往加州硅谷,加盟AMD公司并成为了一名芯片设计师。
两年之后,他跳槽到了另一家芯片公司 LSI Logic(巨积)工作。不过,就在1992年黄仁勋取得斯坦福大学硕士学位之时,却又辞去了工作,并开始筹划其曾立下的“30岁承诺”。
原来,黄仁勋曾经对他的妻子 Lori 作出过承诺——他一定会在30岁之时拥有自己的公司。于是,1992年底,在两位曾经于 SUN 工作过的技术人员之邀请下,他欣然应允一同创业。
1993年初,黄仁勋、Chris (克里斯·马拉科夫斯基)、 Priem(卡蒂斯·普里姆)三人,在美国加利福尼亚州正式创办了 。
同时,为了兑现承诺,他将第一天上班的日子定在了1993年的2月17日——正是他的30岁生日(下图便是这历史性一天的旧照)。“顽童”的特性,可谓是伴随着黄仁勋的整个人生。
创立的时候,市场上足足有20多家图形芯片公司——三年后这个数字更是飙升到了70家!但是,三位创始人还是凭借着满腔的热爱,义无反顾地投身于这个市场当中。
1994年, 与 SGS- (1998年更名为意法半导体)达成了首个战略合作伙伴关系,共同研发制造单芯片图形用户界面加速器。
不过,当时 选择了并不被人看好的正方形绘图技术;同时,其又重视芯片的多功能性,因此选择了集成游戏手柄、声卡等多重功能的芯片设计思路,欲进入游戏机市场。
另外,当时 还选择了著名的 , Inc. (帝盟公司)作为商业合作伙伴——准备让其将芯片安装在多媒体加速器板上。
1995年五月份,首款产品NV1正式诞生。同年七月尾,又与街机游戏领导者 SEGA(世嘉)建立了伙伴关系;在世嘉的助力下,“VR战士”成为了首款在 显卡上运行的3D游戏。
同年十一月份,帝盟推出了基于技术的 Edge 3D,这是第一款主流多功能芯片:集成了操纵杆、游戏端口、声效、显示、2D、3D等多种功能。
当时 的运气挺不错,其不仅与世嘉合作让NV1芯片额外得到了一些应用,同时还为下一代产品NV2争取到了世嘉的一笔高达700万美元之研发订金!
但由于 强烈希望保留其成熟的正方形绘图技术,而多边形渲染技术又是未来的发展之路,所以世嘉和 便因此起了冲突。最终,NV2芯片还没有开发完成就被世嘉放弃。
后来世嘉选择了3dfx,作为新的合作伙伴。不过值得庆幸的是,世嘉在黄仁勋的恳求下并没有收回订金,而这笔钱却帮助 撑到了Win95时代的到来。
在经历了NV1的勉强度日和NV2的胎死腹中之后,英伟达最终决定放弃多媒体加速芯片的研发,转而专注于PC专用的2D/3D显卡,以此降低研发成本。
1996年三月份, 和游戏开发者联盟制订 3D 的主要规则,推出首款支持的 驱动程序。同年六月份,则将主要力量投入开发台式电脑专用的领先显示芯片。
1997年四月份,推出全球首款的3D处理器 RIVA 128(核心代号为NV3),这也是第一款支持微软 加速的图形芯片。
当时已经流行开了,所以黄仁勋在总结了NV1、NV2的经验教训之后,决定在实力不足以制定规则的情况下,那就顺应潮流,所以才将微软的 作为优先支持的API。
事实证明,这个决定异常正确!虽然RIVA 128在图像质量上比不了当时主流的3dfx ,但是凭借着低廉的价格和高性能的2D/3D加速能力,以及对于AGP1x接口的支持,其迅速获得了OEM厂商的认可。
1997年八月份,成功与 Dell、、 建立了合作伙伴关系,并在接下来的四个月里完成了一百万台的出货量!依靠强大的微软平台和卓越的战略眼光, 取得了一场难得的胜利!
1998年三月份,正式与台积电签约建立合作伙伴关系;接下来的五月份,联手微软在电脑游戏开发者会议推广他们共同开发的 6.0;后面的九月份,则成功入选结构审核委员会。
同时,年内发布的行业第一款多纹理3D显示芯片——RIVA TNT(核心代号为NV4)凭借着优异性能继续抢占市场,而另一款同年发布的 Vanta 显示芯片则进入了商用台式电脑市场。
1999年四月份, 再接再厉,推出了往后“英伟达显卡王朝”的基石产品——RIVA TNT2(核心代号为NV5)。也是从这代开始,依靠着众多衍生型号,黄氏显卡的市场化细分正式开始。
(二)英伟达显卡王朝
之所以RIVA TNT2能依靠众多衍生型号切入各细分市场,皆仰赖于其自身强大的性能——在制程工艺升级的情况下核心频率和显存容量皆有极大提升,以及其更具优势的价格。
反观 最大的竞争对手3dfx,不仅在新产品上“挤牙膏”,还采用了AGP2x接口故仅支持16位色彩,而RIVA TNT2是AGP4x接口所以支持高达32位色彩!也就是说,的显卡性价比明显更高,于是消费者纷纷投向怀抱。
而且这时候的3dfx已经痛失了世嘉这棵“大树”,同时又因为独自造显卡而失去了帝盟、技嘉、创新、艾尔莎等大厂的支持,雪上加霜的是这些大厂还都转投了 !
不过,真正让崛起,并彻底打败3dfx的,还是1999年八月份发布的全球首款 GPU( Unit,即“图形处理器”)——那款极具里程碑意义的 。
其首次加入了硬件 T&L,全称为 &,即“坐标转换和光影计算”,从而减少了CPU的处理量,让显卡成为了电脑的核心硬件并彻底解放CPU。后面的十一月份,又发布了全球最快的工作站GPU——。
值得一提的是,就是在1999年初,在纳斯达克()挂牌上市,并在年内达成了显示芯片出货量破一千万个的里程碑记录!一套“组合拳”下来,3dfx彻底被打懵了!
的出现,直接改变了业内的竞争格局。因为之前用“高端CPU+显卡”才能完成的工作,如今只需用“便宜点的CPU+”便能完成,而且流畅度还更好!
花更少的钱办同样的事,还更具效率,这么具有革命性的事情,就这样被做到了!得益于这番优异表现,2000年三月份 成功拿到了微软首款XBOX游戏机的图形处理器订单——辗转多年后又回到了最初想攻占的游戏机市场。
同年又推出了,并基于此推出了其它丰富的产品线,例如十一月份发布的全球首款笔记本电脑GPU即 Go;从此,这招“阉割大法”便成了N卡的招牌打法,并屡试不爽!
2000年十一月份,收购了一代显卡王者3dfx的知识产权(核心图形资产),数年“显卡争霸”最终以 全面胜利收尾。而接下来要面对的,便是另一家显卡劲敌 ATI。
2001年二月份,推出了业内首款可编程GPU——,从而使得开发者能够创建定制视觉效果。这时候的 发展势头极其迅猛,在2002年二月份直接越过了一亿个绘图处理器的出货量大关!
2003年,又收购了无线领域图形和多媒体技术的领导者 MEDIA Q(成立于1997年),借此切入包括手机、PDA、LCD显示器以及其它移动设备的无线移动市场。
2004年六月份, 的SLI技术问世,其允许将多个GPU连接在一起,从而大大提升了单台PC的图形处理能力。至此,ATI已经有了全面溃败的迹象,与之相对的便是 之所向披靡。
同年成功与暴雪娱乐合作,发布了采用3D图形技术的游戏“魔兽世界”,这款大型多人在线游戏很快成为了全球最热门的游戏。次年,又开始为索尼开发处理器。
2005年尾,宣布收购总部位于台湾的核心逻辑技术开发商 ULi (宇力电子),此举既打击了以宇力作为南桥芯片供应商的 ATI 又壮大了自身的技术实力,可谓是一举两得!
2006年,CUDA 架构问世,这是一种用于通用GPU计算的革命性架构。同年收购了 (1994年创立于芬兰),这是一家为手持设备开发嵌入式2D和3D图形软件的开发商。
反观另一边,2006年ATI被 AMD 以54亿美元巨资收购,接下来的“双雄争霸”直接变成了接力的AMD和之相斗格局。2007年,Tesla GPU 诞生,其所提供的堪比超级计算机之算力,被广泛使用于药物研发、医学成像和天气建模等领域。
此外,2007年还收购了 ,这是一家为个人媒体播放器提供半导体、固件和软件的供应商。同年尾,正式启用官方中文名“英伟达”——英伟达王朝至此开始成型。
2008年,英伟达低调收购了 (1986年创建于德国)。这家公司是视觉渲染软件领域的领导者,其Iray软件与 GPU相结合,通过逼真的设计渲染效果为创意专业人士提供即时反馈。
另外,同年还收购了游戏物理技术开发商AGEIA,这家公司的PhysX软件在游戏中用于再现物理性质对物理世界中的物体之影响效果。当时英特尔已经收购了另一家物理加速卡公司Havok,英伟达则携AGEIA与之对抗,AMD只能黯然观战。
2009年,在第一届GPU技术大会上英伟达发布了名为 Fermi(费米)的新一代 CUDA GPU 架构。此架构虽性能极强但功耗也极高,所以2010年十一月份推出的该架构之旗舰产品便被戏称为“核弹显卡”。
2011年初,在CES大会上推出 (丹佛计划) ,首次为PC开发基于ARM指令集的超高效定制架构CPU。次年,发布了基于全新 (开普勒)架构的 系列显卡。
这代的功耗表现相较于前代进步很大,特别是其中的旗舰型号,不仅帮助英伟达夺回了单芯显卡卡皇的宝座,还成为了N卡发展方向的转折点——削减与游戏无关的结构专注图形性能从而大幅提升能效比。
事实证明,计算卡和游戏卡分开发展是极具里程碑意义的战略规划,从此英伟达的游戏显卡发展速度一骑绝尘,将A卡越甩越远(直到2019年AMD才无奈宣布也会采取游戏卡和计算卡分开设计的策略)。
2013年,又推出了面向游戏玩家的 GTX TITAN,其诞生可谓开启了“超级计算机游戏时代”。同年,收购了 Group(创立于1989年),进而推动英伟达为加速计算革命创建开发者工具的进程。
2014年,推出 (麦克斯韦)GPU 架构,能效比继续大幅提升。2016年,全新的 (帕斯卡)架构诞生,叠加全新的16nm制程工艺,直接助力甜点产品成为英伟达历史上最为畅销的显卡!
至此,英伟达的显卡王者地位可谓固若金汤,双雄争霸已分胜负——AMD在其步步紧逼之下毫无还手之力(特别是高端领域)。既然桌面端纷争已尘埃落定,那么在其布局已久的移动端,英伟达的表现又如何呢?
(三)屹立 AI 浪潮之巅
2003年收购 MEDIA Q 后不久, 便推出了旗下首款专为移动计算设计的产品,此后的年份相继推出了多款此类芯片。但事实证明,独立的GPU芯片在移动计算产品中几无立足之地。
于是, 转而开发SoC芯片,开始将 ARM CPU 和自家移动GPU(2006年收购的 发挥了很大作用)集成在一起。最终在2008年,Tegra 移动处理器问世——至此英伟达正式参与到移动计算平台的竞争中。
到了2011年初,英伟达正式推出了全球首款双核移动处理器 ,并在此基础上打造出首款安卓平板电脑。同年十一月份,英伟达铆足了劲,又再接再厉发布了全球首款四核移动芯片 。
可惜虽然性能提升很大,但由于制程工艺并没有升级,所以功耗表现一言难尽(其实前代的发热量已经很“感人”了),2012年发布并号称“世界首款四核手机”的 HTC One X 便深受其荼毒。
2013年初,继续发布了全新一代的四核移动处理器和首款完全集成4G LTE基带的移动处理器 ,这代的制程升级为当时最先进的台积电28nm工艺——意欲以此打一场翻身仗!
结果所集成的那款号称“世界最强”之GPU,却依然沿用老旧的分离渲染架构,所以一旦到了需要统一渲染架构的 ES 3.0环境就会直接罢工!而且72核GPU与采用公版A15架构的CPU发热都很严重。
更糟糕的是,这款处理器还没有集成基带!所以当年小米3移动版便选择了外挂展讯基带,以致当时的信号体验极差;再加上的CPU和GPU拖后腿,各种发热、卡顿、兼容性差的缺点直接暴露无遗!
虽然还有一款集成了基带芯片且在GPU核心规模做了缩减的,但由于上市时间太晚,所以一直到高通的骁龙800普及也没有兴起什么风浪,关键在性能方面其也没有什么优势。
最终,在4G普及的“前夜”,高通靠着全自研的CPU和GPU架构,以及SoC集成的“全网通”基带方案,彻底把包括英伟达和德州仪器在内的一众劲敌远远甩在了身后,英伟达就此黯然退出了手机芯片市场。
2014年,英伟达推出了基于28nm制程工艺的Tegra K1。该型号有两种方案,其一是32位的四核-A15架构,主要产品是小米平板初代,另一个则是双核64位的自研丹佛()架构。
其GPU升级到了开普勒()架构,共有192个CUDA核心,而且这回终于是统一渲染架构了!综合有着入门级独立显卡的性能实力。当然,随着性能的飞涨,功耗与发热自然也非常高,基本是不指望在手机上使用的。
而且,这时候英伟达已经退出了火热的手机芯片市场,所以这款性能非常强大的芯片只能在安卓平板中寻求一席之地,或者安装在英伟达自家的掌机中,此外也有部分车企采购这款芯片应用于车机上。
2015年初,继续推出Tegra X1,制程升级为台积电20nm工艺。CPU采用了“四颗A57+四颗A53”的八核架构,GPU则升级为麦克斯韦()架构,其拥有256个CUDA核心。
这款功耗很高的“核弹芯片”非常成功,因为英伟达运气爆棚遇到了一个大客户——即游戏机大佬任天堂,更幸运的是其成为了后面爆火的 搭载之芯片!
上市的时候,已是2017年,这时候 Tegra 移动处理器系列刚好走过了一个十年的历程。但“好饭不怕晚”,搭乘 的东风,Tegra 移动处理器终于迎来了大展拳脚的机会!
2016年八月份,又继续推出了 Tegra ,制程升级为16nm工艺。其中CPU采用了“四颗A57+两颗”的六核架构,GPU则升级为全新的帕斯卡()架构。
紧接着的九月份,又发布了 ,制程升级为12nm工艺;这是英伟达首款为高级自动驾驶研发的芯片,同时也面向机器人和边缘计算等计算平台。不过这款产品一直到两年后才交样,至于量产更是要等到2020年。
Tegra 系列芯片发展到了 这代,已经不仅仅是一个处理器了,而是完成了华丽蜕变——成为了一个提供人工智能的超级计算机(所以去掉了“Tegra”前缀)!
要说起英伟达称霸AI领域的源头,还得追溯到2006年推出的用于通用GPU计算的 CUDA 架构上。其革命性之处在于,能够在庞大运算问题中,通过 CUDA 编程充分利用GPU的并行处理能力。
打个比方,假如让一个数学教授和100个小学生比数学能力,那么扔一道高等数学方程下来,数学教授轻松搞定,100个小学生则当场懵逼;但若扔100道四则运算题下来,那么100个小学生的抱团计算速度就要远远超过那个数学教授!
在这里,数学教授扮演的就是CPU角色,那100个小学生则扮演了GPU那100个核心的角色,而那100道四则运算题指的就是通用GPU计算。恰好,人工智能深度学习所依赖的,便是通用GPU计算!
2016年,英伟达推出全球首款一体化深度学习超级计算机——DGX-1,这是一款搭载了8块P100加速器的超算,可强力支持人工智能应用程序。当时黄仁勋独具慧眼,第一台DGX-1直接捐给了初创的 。
2018年,再接再厉推出了 (图灵)GPU 架构,为全球首款具备实时光线追踪功能的 GPU(即RTX 8000)提供支持。实时光追长期以来一直被视为计算机图形技术的终极目标,英伟达此举可谓重塑了计算机图像技术。
2019年,丰田和沃尔沃集团与英伟达共同签署了合作协议,开始使用 DRIVE 端到端平台,以开发和训练安全的自动驾驶汽车,并部署到全球的交通运输行业。
2020年,英伟达收购了高性能互联技术领域的领头羊 (迈络思,成立于1999年),HPC领域的两家卓越公司就此合二为一。同年隆重推出了 (安培)GPU 架构,助力实现一种全新之功能强大且灵活的数据中心。
2022年十一月底, 旗下的人工智能对话聊天机器人 推出,此后迅速在社交媒体上走红爆火。而实际处理 的GPU,正是英伟达基于安培架构的HGX A100!
起始于2020年九月份的“英伟达400亿美元收购ARM”之交易,在2022年二月份正式因严格监管审查及竞争对手的反对而以失败告终,英伟达为此支付了软银12.5亿美元的巨额“分手费”。
究其原因,皆在于ARM本身实在太过重要所致。如今在移动市场,有超过90%的智能手机和平板电脑以及其他移动设备都在采用ARM提供的架构,更不用提在物联网领域了,所以欧盟、中国以及美国科技巨头(例如谷歌、苹果、高通)等皆极力反对。
不过,这对于英伟达来说只能算是“小赌怡情”的小插曲。这几年除了继续称霸显卡领域外,得益于人工智能和自动驾驶的迅猛发展,其市值已超3万亿美元——荣登全球市值第二高之宝座!